











n 从 初学 者 的 角度 出 发 ， 以 通俗 易 慌 的 语言 ， 配 合 丰富 多 彩 的 实例 ， 详 细 介绍 使 用 Linux C/C++ 
进行 企业 级 程序 开发 应 该 掌握 的 各 方面 知识 
血 集 基 础 知识 、 核 心 技能 、 高 级 应 用 、 项 目 案例 于 一 体 ， 易 于 学 习 、 易 于 掌握 、 易 于 应 













































































Linux C 与 C++ 
一 线 开发 实 





id d b nat 


à 


Linux C 与 C++ 
一 线 开 发 实践 





朱文 伟 李 建 英 著 


id d 4x nat 
北京 


内 容 简 介 


Linux C/C++ 编程 在 Linux 应 用 程序 开发 中 占有 重要 的 地 位 ， 掌 握 这 项 技能 将 在 就 业 竞争 中 立 于 不 败 
之 地 。 本 书 是 一 本 针对 初 、 中 级 读者 的 、 贴 近 软 件 公司 一 线 开 发 实践 的 书 。 

本 书 共 分 为 19 章 ， 内 容 包括 Linux 概述 、 搭 建 开发 环境 、 语 言 基 础 、 文 件 编程 、 多 进程 编程 、 进 程 
间 通 信 、Web 编程 、 多 线程 编程 、Linux 下 的 库 、TCP/IP 协议 基础 、 网 络 编程 、 网 络 性 能 测试 工具 iPerf 
简 析 、 版 本 控制 和 SVN 工具 、C++ 跨 平台 开发 以 及 安全 编程 等 。 

本 书 适 合 想 全 面 学 习 Linux 环境 下 C/C++ 语言 编程 的 读者 ， 并 可 作为 初中 级 开发 人 员 的 案头 查阅 与 
参考 手册 ， 也 适合 作为 高 等 院 校 和 培训 学 校 相关 专业 师 生 的 教学 参考 书 。 





本 书 封 面 贴 有 清华 大 学 出 版 社 防伪 标签 ， 无 标签 者 不 得 销售 
版 权 所 有 ， 侵 权 必 究 。 侵 权 举 报 电话 : 010-62782989 13701121933 


图 书 在 版 编目 CCIP) 数据 


Linux C 与 C++ 一 线 开 发 实践 / 朱文 伟 ， 李 建英 著 . 一 北京 : 清华 大 学 出 版 社 ，2018 
ISBN 978-7-302-51255-4 


L OL IL. Ok @ 李 …IIL CDLinux 操作 系统 一 程序 设计 CC 语言 一 程序 设计 GOC++ 语 言 
一 程序 设计 IV. CDTP316.89 Q)TP312.8 


中 国 版 本 图 书馆 CIP 数据 核 字 (2018) 第 213834 号 


AR: L 
封面 设计 : cro 
责任 印 制 : EHA 


出 版 发 行 : 清华 大 学 出 版 社 
网 址 : http://www.tup.com.cn, http://www.wqbook.com 

















地 址 : 北京 清华 大 学 学 研 大 厦 A 座 AB ” 编 ，100084 

社 总 机 : 010-62770175 AB W: 010-62786544 
投稿 与 读者 服务 : 010-62776969, c-service@tup.tsinghua.edu.cn 

质量 反馈 : 010-62772015, zhiliang@tup.tsinghua.edu.cn 

印 装 者 : 北京 密云 胶印 厂 

经 WH: 全 国 新 华 书店 

Æ ”本 : 190mmx260mm ED ” 张 : 44.75 字 ” 数 : 1152 千 字 

版 ”次 : 2018 年 12 月 第 1 版 印 ”次 : 2018 年 12 月 第 1 次 印刷 
Æ f: 129.00 元 


产品 编号 : 072288-01 


HU m 


这 是 一 本 Linux C/C++ 入 门 的 经 典 图 书 。 任 何 学 过 C/C++ 语言 并 立志 成 为 一 名 Linux 开发 工程 
师 的 朋友 ， 都 可 以 从 本 书 起 步 。 本 书 虽然 有 点 厚 ， 但 内 容 通 俗 易 懂 ， 由 浅 入 深 ， 并 且 实 例 丰富 、 步 
又 详细 、 注 释 充 分 ， 相 信 大 家 都 能 看 得 懂 。 对 于 中 高 级 开发 人 员 ， 也 可 以 通过 本 书 快 速 上 手 Linux 
C/C++ 的 实际 开发 。 本 书 并 没有 详细 讲述 C++ 语言 部 分 〈 但 也 进行 了 一 定 程度 的 叙述 ) ， 而 是 把 更 
多 的 笔墨 放 在 Linux 编程 方面 ， 因 此 书 中 都 是 实 实在 在 的 Linux 编程 “干货 ”。 此 外 ， 实 例 丰 富 是 
本 书 的 一 大 特点 ， 大 家 应 该 知道 ， 编 程 开 发 只 是 了 解 理论 是 不 够 的 ， 只 有 自己 上 机 调试 运行 实例 ， 
才能 深刻 理解 编程 ， 尤 其 是 CC++。 另 外 ， 为 了 照顾 初学 者 ， 每 个 实例 步骤 都 非常 详细 ， 并 且 从 建 
立 工程 到 运行 工程 都 有 着 丰富 的 注释 。 最 后 ， 本 书 所 有 例子 都 在 CentOS 7 上 用 gcc/g++ 编 译 通过 。 

本 书 在 讲述 基本 编程 的 同时 ,也 讲述 了 很 多 一 线 实 践 开 发 中 经 常会 碰 到 的 问题 和 解决 方案 , 可 
以 说 本 书 是 紧 贴 工业 界 的 图 书 。 希 望 大 家 能 够 通过 本 书 的 学 习 打 好 Linux 开发 的 基础 ， 早 日 成 为 
Linux C/C++ 开 发 高 手 。 
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1.4 什么 是 Linux 


讲 到 开源 操作 系统 软件 Linux, 就 不 能 不 提 GNU 计划 , 真是 因为 GNU 计划 , 才 使 得 包括 Linux 
在 内 的 各 种 著名 开源 软件 莲 勃 发 展 起 来 。 所 以 在 介绍 Linux 之 前 ， 首 先 要 介绍 一 下 GNU 计划 。 

GNU 计划 在 1983 年 9 月 27 日 公开 发 起 ， 创 始 人 是 Richard Stallmans GNU 计划 的 目标 是 创 
建 一 套 完全 自由 的 操作 系统 。 

如 何 创建 ， 基 于 什么 思想 呢 ? 当时 UNIX 操作 系统 是 主流 的 商业 操作 系统 ， 因 此 GNU 把 目光 
投向 了 UNIX 操作 系统 , 即 实现 一 个 与 UNIX 接口 标准 兼容 的 操作 系统 ,同时 要 开发 出 一 些 基 础 软 
件 。 

GNU 计划 的 另 一 个 重要 内 容 是 许可 证 , 主要 有 GPL. LGPL 和 GFDL. GNU 通用 许可 证 (GNU 
Gerneral Public License, 简称 GPL) 是 一 个 广泛 使 用 的 自由 软件 许可 证 ， 经 历 了 不 同 的 版 本 ， 比 如 
1989 年 1 月 发 布 了 1.0 版 本 ，1991 年 6 月 发 布 了 2.0 版 本 ,2007 年 6 月 发 布 了 3.0 版 本 , 其 中 GPL 
2.0 版 是 最 为 广泛 使 用 的 版 本 。GNU 自由 文档 许可 证 CGNU Free Document License， 简 称 GFDL) 
是 一 个 内 容 开 放 的 著作 版 权 许可 证 ， 于 2000 年 发 布 ， 是 自由 软件 基金 会 为 GNU 计划 而 发 布 的 。 
后 来 也 发 展 了 几 个 新 版 本 ， 比 如 2000 年 3 月 发 布 的 1.1 版 、2002 年 12 月 发 布 的 1.2 版 和 2008 年 
11 H 3 日 发 布 的 1.3 版 。 

GNU 计划 大 大 促进 了 开源 软件 的 发 展 ， 但 使 得 GNU 计划 名 声 大 噪 的 却 是 Linux 操作 系统 。 
人 们 是 从 Linux 操作 系统 开始 知道 GNU 计划 的 。 

准确 地 讲 ，Linux 是 一 个 操作 系统 的 内 核 ， 即 内 核 的 名 字 叫 Linux， 而 不 是 指 整 个 操作 系统 叫 
Linux， 但 现在 人 们 已 经 习惯 把 Linux 等 价 于 一 个 操作 系统 ,而 说 到 内 核 的 时 候 只 能 嘱 唆 地 说 Linux 
内 核 ， 习 惯 的 力量 是 强大 的 。 

Linux 内 核 最 初 是 由 芬兰 人 林 纳 斯 托 瓦 兹 (Linus Torvalds ) 在 赫尔辛基 大 学 上 学 时 开发 出 来 的 ， 
完全 出 于 爱好 和 方便 。 他 在 1991 年 9 月 发 布 了 第 一 个 版 本 ， 此 后 一 发 不 可 收拾 。Linux 内 核 迅速 
得 到 大 家 认可 ， 并 持续 开发 新 版 本 ， 很 快 Linux 成 为 享誉 全 球 的 开源 操作 系统 。 在 这 个 过 程 中 ， 
GNU 的 GPL 协议 成 了 Linux 迅速 发 展 的 重要 保障 。 

Linux 是 一 个 内 核 ， 只 有 内 核 还 不 能 成 为 一 个 完整 的 操作 系统 ， 而 且 Linux 内 核 并 不 是 GNU 
的 组 成 部 分 。 此 时 ，GNU 计划 下 的 各 种 操作 系统 工具 有 了 用 武之 地 ， 它 们 完美 地 和 Linux 内 核 结 
合 在 一 起 ， 迅 速成 为 一 个 完整 可 用 的 操作 系统 ， 因 此 我 们 通常 称 Linux 操作 系统 为 GNU/Linux 操 
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作 系 统 。GNU 有 了 Linux 操作 系统 ， 于 是 该 计划 就 被 大 家 知道 了 。 

前 面 提 到 GNU 和 希望 实现 一 个 与 UNIX 接 口 标准 兼容 的 操作 系统 ,而 Linux 作 为 一 个 类 UNIX 
系统 ， 基 本 符合 UNIX 的 一 个 重要 标准 一 一 POSIX 标准 。 该 标准 是 IEEE 为 要 在 UNIX 操作 系 
统 上 运行 的 软件 而 定义 的 一 些 API 接口 的 标准 ， 目 的 是 提高 代码 的 可 移植 性 。POSIX 的 正式 名 
称 是 IEEE 1003, 国际 名 称 是 ISO/IEC9945, 全 称 是 Portable Operating System Interface (可 移植 
操作 系统 界面 ) 。 

目前 ，Linux 操作 系统 在 服务 器 领域 、 嵌 入 式 领 域 、 党 政 军 涉 密 领 域 、 国 产 化 自主 可 控 领 域 应 
用 非常 广泛 。 大 家 学 好 Linux 可 谓 大 有 前 途 。 


1.2 Linux 的 简 史 


为 什么 要 了 解 Linux 的 历史 呢 ? 方便 以 后 研究 Linux 内 核 代 码 , 因为 研读 Linux 内 核 代码 的 时 
候 都 是 从 最 基本 、 最 初 的 内 核 代 码 开始 研读 的 。 

最 早 在 1991 年 8 月 ， 芬 兰 一 个 名 为 Linus Torvalds 的 大 学 生 ， 开 发 出 了 一 个 可 系统 ， 运 行 在 
IBM 386 以 上 的 电脑 上 。 在 1991 年 10 H 5 日 ，Linus Torvalds 在 新 闻 组 comp.os.minix 发 布 了 大 约 
有 一 万 行 代码 的 Linux v0.01 版 本 。 到 了 1992 年 ， 大 约 有 1000 人 在 使 用 Linux， 值 得 一 提 的 是 ， 
他 们 基本 上 都 属于 真正 意义 上 的 hacker CHA) 。 

到 了 1993 年 ， 大 约 有 100 余 名 程序 员 参 与 了 Linux 内 核 代 码 的 编写 和 修改 工作 ， 其 中 核心 组 
由 5 人 组 成 ， 此 时 Linux 0.99 的 代码 大 约 有 10 万 行 ， 用 户 大 约 有 10 万 。 

1994 年 3 月 ，Linux 1.0 发 布 ， 代 码 量 为 17 万 行 ， 当 时 是 完全 按照 自由 免费 协议 发 布 的 ， 随 后 
正式 采用 GPL 协议 。 至 此 ，Linux 的 代码 开发 进入 良性 循环 。 很 多 系统 管理 员 开 始 在 自己 的 操作 
系统 环境 中 尝试 Linux， 并 将 修改 的 代码 提交 给 核心 小 组 。 由 于 拥有 了 丰富 的 操作 系统 平台 ， 因 此 
Linux 的 代码 中 也 充实 了 对 不 同 硬件 系统 的 支持 ， 大 大 地 提高 了 跨 平 台 移 植 性 。 

1995 ££, Linux 已 可 在 Intel, Digital 以 及 Sun SPARC 处 理 器 上 运行 ,用 户 量 也 超过 了 50 万 ， 
相关 介绍 Linux 的 Linux Journal 杂志 也 发 行 了 10 万 多 册 。 

1996 年 6 月 ，Linux 2.0 内 核发 布 ， 此 内 核 有 大 约 40 万 行 代码 ， 并 可 以 支持 多 个 处 理 器 。 此 时 
的 Linux 已 经 进入 实用 阶段 ， 全 球 大 约 有 350 万 人 使 用 。 

1997 年 夏 ， 大 片 《 泰 坦 尼 克 号 》 在 制作 特效 中 使 用 的 160 £ Alpha 图 形 工作 站 中 ， 有 105 台 
采用 了 Linux 操作 系统 。 

1998 年 是 Linux 迅猛 发 展 的 一 年 。1 月 ， 小 红 帽 高 级 研发 实验 室 成 立 ， 同 年 RedHat 5.0 获得 
了 InfoWorld 的 操作 系统 奖项 。4 月 ，Mozilla 代码 发 布 ， 成 为 Linux 图 形 界面 上 的 王牌 浏览 器 。 
RedHat 宣布 支持 商业 计划 ， 召 集 了 多 名 优秀 技术 人 员 开 始 商业 运作 。 王 牌 搜索 引擎 Google 现 身 ， 
采用 的 也 是 Linux 服务 器 。 值 得 一 提 的 是 ，Oracle 和 Informix 两 家 数据 库 厂商 明确 表示 不 支持 
Linux， 这 个 决定 给 予 MySQL 数据 库 充 分 的 发 展 机 会 。 同 年 10 月 ，Intel 和 Netscape 宣布 小 额 投 资 
红 帽 软 件 ， 这 被 业界 视 作 Linux 获得 商业 认同 的 信号 。 同 月 ， 微 软 在 法 国 发 布 了 反 Linux 公开 信 ， 
这 表明 微软 公司 开始 将 Linux 视 作 一 个 对 手 。12 H, IBM 发 布 了 适用 于 Linux 的 文件 系统 AFS 3.5 
以 及 Jikes Java 编辑 器 和 Secure Mailer 及 DB2 测试 版 。IBM 的 此 番 行 为 可 以 看 作 是 与 Linux 2:8 
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答 的 第 一 次 亲密 接触 . 迫 于 Windows 和 Linux 的 压力 , Sun 逐渐 开放 了 Java 协议 , 并 且 在 UltraSparc 
上 支持 Linux 操作 系统 。1998 年 可 以 说 是 Linux 与 商业 接触 的 一 年 。 

1999 年 ，IBM 宣布 与 RedHat 公司 建立 伙伴 关系 ， 以 确保 RedHat 在 IBM 机 器 上 正确 运行 。3 
月 ， 第 一 届 LinuxWorld 大 会 召开 ,象征 着 Linux 时 代 的 来 临 。IBM、Compaq 和 Novell 宣布 投资 
RedHat 公司 , 以 前 一 直 对 Linux 持 否 定 态度 的 Oracle 公司 也 宣布 投资 。5 月 , SGI 公司 宣布 向 Linux 
移植 其 先进 的 XFS 文件 系统 。 对 于 服务 器 来 说 ， 高 效 可 靠 的 文件 系统 是 不 可 或 缺 的 ，SGI 的 慷慨 
移植 再 一 次 帮助 了 Linux 确立 在 服务 器 市 场 的 专业 性 。7 月 ，IBM 启动 对 Linux 的 支持 服务 并 发 布 
了 Linux DB2， 从 此 结束 了 Linux 得 不 到 支持 服务 的 历史 ， 这 可 以 视 作 Linux 真正 成 为 服务 器 操作 
系统 一 员 的 重要 里 程 碑 。 

2000 年 初始 ，Sun 公司 在 Linux 的 压力 下 宣布 Solaris 8 降低 售 价 。 事 实 上 ，Linux 对 Sun 造成 
的 冲击 远 比 对 Windows 更 大 。2 H, RedHat 发 布 了 嵌入 式 Linux 的 开发 环境 ，Linux 在 嵌入 式 行 
业 的 潜力 逐渐 被 发 掘 出 来 .4 月 , 拓 林 思 公 司 宣布 推出 中 国 首 家 Linux 工程 师 认 证 考试 ,从 此 使 Linux 
操作 系统 管理 员 的 水 准 可 以 得 到 权威 机 构 的 资格 认证 , 此 举 大 大 增加 了 国内 Linux 爱好 者 学 习 的 热 
情 。 伴 随 着 国际 上 的 Linux 热潮 ， 国 内 的 联想 集团 推出 了 “幸福 Linux 家 用 版 ”， 同 年 7 月 ， 中 科 
院 与 新 华科 技 合作 发 展 红旗 Linux, 此 举 让 更 多 的 国内 个 人 用 户 认 识 到 了 存在 Linux 这 个 操作 系统 。 
11 H, Intel 与 Xteam 合作 ， 推 出 基于 Linux 的 网 络 专用 服务 器 ， 此 举 结束 了 Linux 单 向 顺应 硬件 
商 硬件 开发 驱动 的 历史 。 

2001 年 新 年 伊始 就 爆 出 新 闻 ，Oracle 宣布 在 OTN 上 的 所 有 会 员 都 可 以 免费 索取 Oracle 9i 的 
Linux 版 本 ， 从 几 年 前 的 “ 绝 不 涉足 Linux 系统 ”到 如 今 的 主动 献 媚 ， 足 以 体现 Linux 的 发 展 迅 狐 。 
IBM 则 决定 投入 10 亿美 元 扩大 Linux 系统 的 运用 ， 此 举 犹如 一 针 强 心 剂 ， 令 华尔街 的 投资 者 闻 风 
而 动 。 到 了 5 月 这 个 初夏 的 时 节 ， 微 软 公 开 反对 GPL 引起 了 一 场 大 规模 的 论战 。8 月 ， 红 色 代 码 
爆发 ， 引 得 许多 站 点 纷纷 从 Windows 操作 系统 转向 Linux 操作 系统 ， 虽 然 是 一 次 被 动 的 转变 ， 不 
过 也 算是 一 次 应 用 普及 吧 。12 H, Red Hat X IBM S/390 大 型 计算 机 提供 了 Linux 解决 方案 ， 从 此 
结束 了 AIX“ 孤 单独 行 无 人 伴 ” 的 历史 。 

2002 年 是 Linux 企业 化 的 一 年 。2 月 ， 微 软 公司 迫 于 各 州 政府 的 压力 ， 宣 布 扩 大 公开 代码 行动 ， 
这 是 Linux 开源 带 来 的 深刻 影响 的 结果 。3 月 ， 内 核 开 发 者 宣布 新 的 Linux 系统 支持 64 位 的 计算 机 。 

2003 年 1 H, NEC 宣布 将 在 其 手机 中 使 用 Linux 操作 系统 ,代表 着 Linux 成 功 进军 手机 领域 。 
5 月 ，SCO 表示 就 Linux 使 用 的 涉嫌 未 授权 代码 等 问题 对 IBM 进行 起 诉 ， 此 时 人 们 才 留 意 到 ， 原 
本 由 SCO 鸡 断 的 银行 /金融 领域 ,份额 已 经 被 Linux 抢占 了 不 少 。9 月 ,中 科 红 旗 发 布 Red Flag Server 
4 版本， 性 能 改进 良 多 。11 H, IBM 注资 Novell 以 2.1 亿 收 购 SuSE， 同 期 RedHat 计划 停止 免费 
的 Linux， 顿 时 业内 回声 四 起 。Linux 在 商业 化 的 路 上 渐 行 渐 远 。 

“天 下 事 分 久 必 合 , 合 久 必 分 ”，2004 年 1 月 ，SuSE 嫁 到 了 Novell, SCO 继续 项 着 骂 名 四 处 
强行 “化 缘 ”，Asianux、MandrakeSoft 也 在 5 年 中 首次 宣布 季度 赢利 。3 月 ，SGI 宣布 成 功 实现 了 
Linux 操作 系统 支持 256 个 Itanium 2 处 理 器 。 4 月 , 美国 斯 坦 福 大 学 Linux 大 型 机 系统 被 黑客 攻陷 ， 
再 次 证 明了 没有 绝对 安全 的 OS。6 月 的 统计 报告 显示 , 在 世界 500 强 超级 计算 机 系统 中 , 使 用 Linux 
操作 系统 的 已 经 占 到 了 280 席 ， 抢 占 了 原本 属于 各 种 UNIX 的 份额 。9 月 ，HP 开始 网 罗 Linux 内 
核 代 码 人 员 ， 以 影响 新 版 本 的 内 核 朝 对 HP 有 利 的 方向 发 展 ， 而 IBM 则 准备 推出 OpenPower 服务 
器 ， 仅 运行 Linux 系统 。 
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ES, Linx 仍然 经 久 不 误 ， 并 且 越 来 越 受 计算 机 学 习 者 的 追捧 ， 人 们 都 在 大 力学 习 这 个 
操作 系统 ， 虚 拟 机 、 嵌 入 式 系 统 等 领域 都 对 Linux 有 着 情 有 独 钟 的 感情 ， 所 以 学 好 Linux 前 途 
一 片 光明 。 


1.3 Linux $ü Windows 的 比较 


相信 大 家 对 Windows 操作 系统 已 经 是 如 数 家 珍 了 。 现 在 要 接触 新 的 操作 系统 Linux， 可 能 开 
始 有 些 抵触 情绪 ， 为 何 要 学 它 ， 它 和 Windows 有 什么 区 别 ? Linux 和 Windows 两 个 操作 系统 各 有 
优 缺 点 ， 两 者 也 在 很 多 情况 下 互相 借鉴 、 互 相 融 合 。 在 易 用 性 方面 ，Windows 仍然 处 于 优势 ; 在 
灵活 性 方面 ，Linux 则 占据 上 风 ; 在 安全 性 方面 ，Linux 系统 比 Windows 系统 好 ; 在 应 用 软件 支持 
方面 , 一 直 是 Windows 强 ; Linux 的 真正 优势 是 服务 器 操作 系统 和 嵌入 式 操作 系统 。 我们 可 以 通过 
表 1-1 来 了 解 一 下 两 者 的 重大 区 别 。 


表 1-1 Windows 与 Linux 两 者 的 重大 区 别 
特 点 Windows Linux 
安全 性 能 
稳定 性 
软件 支持 
硬件 支持 
源 代码 
系统 可 调节 性 
使 用 方便 性 非常 方便 方便 
版 权限 制 和 费用 E 
技术 支持 | 好 | 基于 社团 形式 的 














1.4 Linux 主要 应 用 领域 


Windows 已 经 牢 牢 占据 了 普通 用 户 的 桌面 PC 市 场 。 那么 Linux 呢 ， 它 的 主要 应 用 领域 在 哪里 
WE? Linux 操作 系统 源 代 码 公 开 和 免费 的 特点 使 其 迅速 发 展 壮 大 ,赢得 了 许多 大 型 软件 公司 的 支持 。 
Linux 的 主要 应 用 领域 如 下 : 


(1) Linux 服务 器 〈 中 低 端 的 应 用 服务 器 ) 。 
(2) RAR Linux 系统 〈 信 息 家 电 、 智 能 仪表 、 网 络 安全 产品 等 ) o 
(3) 桌面 市 场 〈 办 公 软 件 、 电 子 政务 ) 。 
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1.5 Linux 的 版 本 


Linux 的 版 本 分 为 发 行 版 本 和 内 核 版 本 ， 而 内 核 版 本 又 分 为 开发 版 本 和 稳定 版 本 。 为 了 安装 方 
fü, Tf Linux 内 核 、 系 统 软 件 /应 用 软件 打包 在 一 起 发 行 ， 称 作 发 行 版 本 。 
Linux 的 内 核 版 本 号 由 3 个 字母 组 成 : r、x、y。 这 3 个 字母 的 含义 如 下 : 


€ r: 目前 发 布 的 内 核 版 本 。 
€ x: 偶数 表示 稳定 版 本 ， 坷 数 表示 开发 中 版 本 。 
€ y: 错误 修补 的 次 数 。 


比如 kernel 2.0.38、kernel 2.6.13-17、kernel 3.10.0. 

我 们 可 以 在 命令 行 下 用 uname -a 或 cat /proc/version 查看 当前 系统 的 内 核 版 本 号 。 

Linux 发 行 (Distribution) 版 〈 套 件 ) 以 Linux Kernel 为 核心 ， 搭 配 各 种 应 用 程序 和 工具 。 许 
多 个 人 、 组 织 和 企业 开发 了 基于 GNU/Linux 的 Linux 发 行 版 。 目 前 有 200 余 种 Linux Distribution, 
Linux 发 行 版 大 体 可 以 分 为 两 类 : 商业 公司 维护 和 社区 组 织 维护 。 前 者 以 著名 的 RedHat (RHEL) 
为 代表 ， 后 者 以 Debian、CentOS 为 代表 。 查 看 发 行 版 本 的 命令 是 : cat /etc/redhat-release。 

当今 比较 流行 的 发 行 版 如 下 : 


Red Hat: http://www.redhat.com, 

Mandrake: http://www.linux-mandrake.com/en/., 
Slackware: http://www.slackware.com/, 

SuSE: http://www.suse.com/index us.html, 
Debian: http://www.debian.org/. 

CentOS: http://www.centos.org/. 

Ubuntu: http://www.ubuntu.com.cn/, 


1.6 使 用 哪个 版 本 的 Linux 进行 学 习 


Linux 发 行 版 众多 ， 有 国内 的 ， 比 如 红旗 ， 也 有 国外 的 ， 比 如 RedHat、CentOS 和 Fedora 等 。 
可 以 根据 个 人 爱好 和 基础 选中 一 款 ， 其 实 差别 也 不 是 非常 大 。 这 里 推荐 CentOS 和 Fedora， 因 为 社 
区 强大 ， 这 就 意味 着 学 习 资料 和 问答 的 地 方 多 。 本 书 采 用 的 Linux 版 本 是 CentOS 7.2。 


1.7 Linux 的 特点 


Linux 操作 系统 最 大 的 特点 是 免费 、 开 源 、 可 以 定制 以 及 功能 强大 。 这 是 它 能 迅速 在 IT 工业 
界 发 展 起 来 的 根本 。 从 功能 方面 具体 地 讲 ，Linux 有 如 下 特点 : 


(1) 真正 的 多 用 户 、 多 任务 操作 系统 。 
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(2) 符合 POSIX (The Portable Operating System Interface) 标准 。 

(3) 提供 shell 命令 解释 程序 和 编程 语言 。 

(4) 提供 强大 的 管理 功能 ， 包 括 远 程 管理 功能 (SSH) 。 

CO 具有 内 核 的 编程 接口 。 

(6) 具有 图 形 用 户 接口 CKDE/GNOME) 。 

CD 具有 大 量 实用 的 程序 和 通信 、 联 网 工具 。 

(8) Linux 系统 组 成 部 分 的 源 代码 是 开放 的 ， 任 何人 都 能 修改 和 重新 发 布 它 。 

(9) Linux 系统 不 仅 可 以 运行 自由 发 布 的 应 用 软件 ， 还 可 以 运行 许多 商业 化 的 应 用 软件 。 

C10) Linux 可 以 运行 在 几乎 所 有 硬件 平台 上 ， 比 如 x86 PC、Sun Sparc. Digital Alpha、680x0、 
PowerPC、MIPS 等 。 


1.8 如 何 学 习 Linux 
一 句 话 : 多 看 书 ， 多 动脑 ， 多 动手 。 
1.9 ”命令 行 还 是 图 形 界面 


如 果 决 定 往 网 络 管理 、 嵌 入 式 开发 方向 发 展 ， 命 令 行 是 必须 要 熟练 的 。 如 果 只 是 做 上 位 机 的 
桌面 开发 ， 图 形 界面 就 可 以 了 。 


1.40 ”计算 机 启动 的 基本 过 程 


对 于 一 台 安 装 了 Linx 系统 的 主机 来 说 ， 当 用 户 按 下 开机 按钮 后 ,一共 要 经 历 如 图 1-1 所 示 的 
几 个 过 程 。 


按 下 电源 


启动 内 核 





图 1-1 
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其 中 ， 每 个 过 程 都 执行 了 自己 该 做 的 初始 化 部 分 ， 有 些 过程 又 可 分 为 好 几 个 子 过 程 。 接 下 来 ， 
我 们 就 对 每 个 阶段 进行 分 析 。 


1.00.4. TE 


按 下 电源 ， 其 实 更 科学 的 称呼 是 上 电 ， 因 为 有 些 嵌 入 式 系统 是 通过 拨 动 电源 开关 来 上 电 的 ， 
没有 按 下 的 按钮 。 任 何 Linux 系统 的 启动 必然 是 从 上 电 开 始 的 。 上 电 后 ，CPU 的 RESET 引 脚 会 由 
特殊 的 硬件 电路 产生 一 个 逻辑 值 ， 这 就 是 CPU 的 复位 ， 此 时 CPU 唤醒 了 ，CPU 将 在 0xfffffffo 处 
执行 一 条 长 跳 转 指 令 ， 直 接 跳 到 固化 在 ROM 中 的 启动 代码 处 (这 个 启动 代码 叫 作 BIOS) ， 并 开 
始 执行 BIOS 代码 。 


1.10.2. BIOS 自 检 


20 世纪 70 年 代 初 , “只 读 内 存 ”(Read-Only Memory; ROM) 发 明 后 ,开机 程序 被 刷 入 ROM 
芯片 ， 计 算 机 通电 后 ， 第 一 件 事 就 是 读 取 它 。 图 1-2 所 示 就 是 一 个 BIOS 芯片 。 











这 块 芯片 里 存放 着 BIOS 代码 。 有 计算 机 基础 的 人 都 应 该 听 过 BIOS (Basic Input / Output 
System) ， 又 称 基本 输入 输出 系统 ， 可 以 视 为 一 个 永久 地 记录 在 ROM 〈 只 读 存 储 器 ) 中 的 软件 ， 
是 操作 系统 输入 输出 管理 系统 的 一 部 分 。 早 期 的 BIOS 芯片 确实 是 “只 读 ” 的 ， 里 面 的 内 容 是 用 一 
种 烧 录 器 写 入 的 ， 一 旦 写 入 就 不 能 更 改 ， 除 非 更 换 芯 片 。 现 在 的 主板 都 使 用 一 种 叫 Flash EPROM 
的 芯片 来 存储 系统 BIOS， 里 面 的 内 容 可 使 用 主板 厂商 提供 的 擦 写 程序 擦 除 后 重新 写 入 ， 这 样 就 给 
用 户 升级 BIOS 提供 了 极 大 的 方便 。 


1. 硬件 自 检 

BIOS 程序 的 主要 作用 是 硬件 自 检 (简称 BIOS 自 检 ) ， 然 后 将 控制 权 转 交 给 下 一 阶段 的 启动 
程序 。BIOS 程序 的 硬件 自 检 也 称 上 电 自 检 (Power-On Self Tes; POST) ， 主 要 负责 检测 系统 外 转 
关键 设备 (如 CPU、 内 存 、 显 卡 、IO 、 键 盘 鼠 标 等 ) 是 否 正 常 。 例 如 ， 最 常见 的 是 内 存 松动 的 情 
况 ，BIOS 自 检 阶段 会 报错 ， 系 统 则 无 法 启动 起 来 。 自 检 中 如 果 发 现 错误 ， 将 按 两 种 情况 处 理 : 对 
于 严重 故障 (致命 性 故障 ) ， 直 接 停机 ， 此 时 由 于 各 种 初始 化 操作 还 没完 成 ， 因 此 不 能 给 出 任何 提 
示 或 信号 ; 对 于 非 严重 故障 则 给 出 提示 或 声音 报警 信号 ， 等 待 用 户 处 理 。 如 果 没有 问题 ， 屏 幕 就 会 
显示 出 CPU、 内 存 、 硬 盘 等 信息 。 图 1-3 所 示 就 是 硬件 自 检 过 程 中 的 一 些 打印 信息 。 
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Diskette Drive 
Master Dis 


B None Serial Port( 
k LBA,ATA 100 SB Parallel 了 

k LBA,ATA 100, DDR at Bank( 
k None 

k None 


sk HDD S R.T apability Disabled 
k HDDS i apability Disabled 


PCI Deuices Listing 
Bu Dev Fun Vendor € 3! SSID Cla Device Cla 


0 27 9 E A005 0403 Multimedia Device 
o 0 F- 4 c03 SB Host Cntrlr 
9 ) 9C93 Host Cntrlr 
0 2 4 1 0C03 Host Cntrlr 
0 3 9C63 USB Host Cntrlr 
0 z 7 t 26! 4 5006 0C03 Host Cntrlr 
0 3 2 £ 2 0101 IDE Cntrlr 
0 3 ) £ 2 1458 2666 O0CO5 SMBus Cntrlr 
1 10DE 0479 0300 Display Cntrlr 

0000 0000 Ma Storage Cntrlr 

1458 E000 < Network Cntrlr 

ACPI Controller 





图 1-3 


2. 查找 引导 设备 

硬件 自 检 完成 后 ，BIOS 将 把 控制 权 转交 给 下 一 阶段 的 启动 程序 。 这 时 ，BIOS 需要 知道 , “下 
-阶段 的 启动 程序 ”具体 存放 在 哪 一 个 设备 。 也 就 是 说 ，BIOS 需要 有 一 个 外 部 储存 设备 的 排序 ， 
排 在 前 面 的 设备 就 是 优先 转交 控制 权 的 设备 。 这 种 排序 叫 作 “启动 顺序 ” (Boot Sequence? . 1T 
F BIOS 的 操作 界面 ， 里 面 有 一 项 是 “ 设 定 启动 顺序 ”， 如 图 1-4 所 示 。 


ist Boot Device ICD/DUD : PS-PHILI Help Item 
2nd Boot Device ICD/DUD : PH -HL -D1 

3rd Boot Device ESATA : IM-SAMSUNI Specifies the boot 
Boot From Other Device Yes] sequence from the 


available devices 


A device enclosed in 
parenthesis has been 
disabled in the 
corresponding type 
menu. 


a Pic:Move Enter:Select */-/:Ualue F10:Saue ESC:Exit Fi:General Help 
CPU Specifications F5:Memoru-Z FH:Fail-Safe Defaults F6:üptimized Defaults 





图 1-4 


1.10.3 ”系统 引导 


BOIS 代码 基本 运行 结束 了 ， 现 在 要 将 引导 程序 代码 载 入 内 存 进 行 运行 。 那 么 引导 代码 在 哪里 
呢 ? 这 里 讲 的 是 PC 上 的 引导 。PC 上 的 引导 代码 (bootloader 程序 ) 分 为 两 部 分 ， 第 一 部 分 位 于 主 





H 
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引导 记录 (MBR) 上 , 这 部 分 先 启动 , 作用 是 引导 位 于 某 个 分 区 上 的 第 二 部 分 引导 程序 , 如 NTLDR、 
BOOTMGR 和 GRUB 等 。 所 以 我 们 经 常见 到 的 GRUB 属于 bootloader， 不 属于 BIOS. 
BIOS 按照 “启动 顺序 ”， 把 控制 权 转 交 给 排 在 第 一 位 的 存储 设备 。 这 时 ， 计 算 机 读 取 该 设备 

的 第 一 个 扇 区 ， 也 就 是 读 取 最 前 面 的 512 字 节 。 如 果 这 512 字 节 的 最 后 两 个 字 节 是 0x55 和 0xAA， 
就 表明 这 个 设备 可 以 用 于 启动 ; 如 果 不 是 ,表明 设备 不 能 用 于 启动 ,控制 权 于 是 被 转交 给 “启动 顺 
序 ” 中 的 下 一 个 设备 。 最 前 面 的 512 字 节 就 叫 作 “ 主 引导 记录 ” (Master Boot Record, MBR) 。 
“ 主 引 导 记 录 ” 只 有 512 字 节 ， 放 不 了 太 多 东西 。 它 的 主要 作用 是 ,告诉 计算 机 到 硬盘 的 哪个 位 置 
去 找 操作 系统 。 主 引导 记录 由 以 下 3 个 部 分 组 成 。 


(1) 第 1~446 字 节 : 调用 操作 系统 的 机 器 码 〈 第 一 部 分 引导 代码 ) 。 
(2) 第 447~510 字 节 : 分 区 表 (Partition Table) 。 
G) 第 511、512 字 节 : 主 引导 记录 签名 (0x55 和 0xAA) 。 


BIOS 把 第 一 部 分 引导 代码 装 入 内 存 后 ， 它 就 退出 了 ， 此 时 第 一 部 分 引导 就 启动 了 。 第 二 部 分 
“分 区 表 ” 的 作用 是 将 硬盘 分 成 若干 个 区 。 将 硬盘 进行 分 区 有 很 多 好 处 。 考 虑 到 每 个 区 可 以 安装 不 
同 的 操作 系统 ， 因 此 “ 主 引 导 记 录 ” 必 须知 道 将 控制 权 转 交 给 哪个 区 。 分 区 表 的 长 度 只 有 64 字 节 ， 
里 面 又 分 成 4 项 ， 每 项 16 字 节 。 所 以 ， 一 个 硬盘 最 多 只 能 分 4 个 一 级 分 区 ， 又 叫 作 “ 主 分 区 ”。 
每 个 主 分 区 的 16 字 节 由 以 下 6 部 分 组 成 。 


CD 第 1 个 字 节 : 如 果 为 0x80， 就 表示 该 主 分 区 是 激活 分 区 ， 控 制 权 要 转交 给 这 个 分 区 。 
个 主 分 区 里 面 只 能 有 一 个 是 激活 的 。 

(2) 582-4 个 字 节 : 主 分 区 第 一 个 扇 区 的 物理 位 置 〈 柱 面 、 磁 头 、 扇 区 号 等 ) 。 

(3) 第 5 个 字 节 : 主 分 区 类 型 。 

(4) 第 6~8 个 字 节 : 主 分 区 最 后 一 个 扇 区 的 物理 位 置 。 

(5) 第 9~12 字 节 : 该 主 分 区 第 一 个 扇 区 的 逻辑 地 址 。 

(6) 第 13~16 字 节 : 主 分 区 的 扇 区 总 数 。 


最 后 的 4 个 字 节 〈 主 分 区 的 扇 区 总 数 ) 决定 了 这 个 主 分 区 的 长 度 。 也 就 是 说 ， 一 个 主 分 区 的 记 
区 总 数 最 多 不 超过 2 的 32 次 方 。 如 果 每 个 扇 区 为 512 字 节 ， 就 意味 着 单个 分 区 最 大 不 超过 2TB。 
再 考虑 到 肩 区 的 逻辑 地 址 也 是 32 位 ， 所 以 单个 硬盘 可 利用 的 空间 最 大 也 不 超过 2TB。 如 果 想 使 用 
更 大 的 硬盘 ， 只 有 两 个 方法 : 一 是 提高 每 个 扇 区 的 字 节 数 ; 二 是 增加 扇 区 总 数 。 

介绍 了 一 些 分 区 表 的 概念 后 ， 我 们 继续 计算 机 的 引导 。 现 在 计算 机 的 控制 权 就 要 转交 给 硬盘 
的 某 个 分 区 了 ， 这 里 又 分 成 3 种 情况 。 


(1) 要 引导 的 操作 系统 位 于 激活 的 主 分 区 里 。4 个 主 分 区 里 面具 有 一 个 是 激活 的 。 计 算 机 会 
读 取 激活 分 区 的 第 一 个 扇 区 ， 这 个 分 区 叫 作 “ 卷 引导 记录 ” (Volume Boot Record, VBR) o “X 
引导 记录 ”的 主要 作用 是 ， 告 诉 计 算 机 ， 操 作 系 统 在 这 个 分 区 里 的 位 置 。 随 后 ， 计 算 机 就 会 加 载 操 
作 系 统 了 。 

(2) 要 引导 的 操作 系统 位 于 逻辑 分 区 里 。 随 着 硬盘 越 来 越 大 ，4 个 主 分 区 已 经 不 够 了 ， 需 要 
更 多 的 分 区 。 但 是 , 分 区 表 只 有 4 项 , 因此 规定 有 且 只 有 一 个 区 可 以 被 定义 成 “扩展 分 区 ”(Extended 
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Partition) 。 所 谓 “ 扩 展 分 区 ”， 就 是 指 这 个 区 里 面 又 分 成 多 个 区 。 这 种 分 区 里 面 的 分 区 就 叫 作 “四 
辑 分 区 ” (Logical Partition) 。 扩 展 分 区 包含 一 个 或 多 个 逻辑 分 区 。 


计算 机 先 读 取 扩展 分 区 的 第 一 个 扇 区 ,， 叫 作 “ 扩 展 引导 记录 ”(Extended Boot Record, EBR) 。 
它 里 面 也 包含 一 张 64 字 节 的 分 区 表 ， 但 是 最 多 只 有 两 个 分 区 项 ， 第 一 个 分 区 项 描述 第 一 个 逻辑 分 
区 , 第 二 个 分 区 项 描述 第 二 个 逻辑 分 区 , 如 果 不 存在 下 一 个 逻辑 分 区 , 第 二 个 分 区 项 就 不 需要 使 用 。 
如 果 有 两 个 分 区 项 ,计算 机 就 可 以 找到 第 二 个 逻辑 分 区 ,接着 会 读 取 第 二 个 逻辑 分 区 的 第 一 个 扇 区 ， 
再 从 里 面 的 分 区 表 中 找到 第 三 个 逻辑 分 区 的 位 置 , 以 此 类 推 , 直到 某 个 逻辑 分 区 的 分 区 表 只 包含 它 
自身 为 止 ( 只 有 一 个 分 区 项 ) 。 因 此 ， 扩 展 分 区 可 以 包含 无 数 个 逻辑 分 区 。 

如 果 要 启动 扩展 分 区 〈 风 辑 分 区 ) 上 的 操作 系统 ， 计 算 机 读 取 “ 主 引导 记录 ”前 面 446 字 节 
的 机 器 码 之 后 ， 不 再 把 控制 权 转 交 给 某 一 个 分 区 ， 而 是 运 先 安装 好 的 “启动 管理 器 ”程序 ( 比 
in GRUB) ， 这 意味 着 第 二 部 分 引导 代码 启动 了 。 它 提示 用 户 选 择 启动 哪 一 个 操 统 。Linux 环 
境 中 ， 目 前 最 流行 的 启动 管理 器 是 GRUB， 如 图 1-5 所 示 。 

































GNU GRUB version 8.97 (637K louer /1846488K upper memory) 


Red Hat Enterprise Linux (2.6.32-279.e15.x86 64) 


Hindows XP SP3 


Use the ^ and + keys to select which entry is highlighted. 
Press enter to boot the selected OS, 'e' to edit the 
commands before booting, 'a’ to modify the kernel arguments 
before booting, or 'c' for a command-line. 





图 1-5 


用 户 选择 后 ， 就 可 以 直接 启动 所 选 的 操作 系统 了 。 系 统 引导 程序 到 此 就 基本 结束 了 ， 下 面 轮 
到 操作 系统 内 核 登场 了 。 


1.10.4 实 模式 和 保护 模式 


从 80386 开始 ，CPU 有 3 种 工作 方式 : 实 模式 、 保 护 模 式 和 虚拟 S086 模式 。CPU 在 刚刚 启动 
的 时 候 工作 模式 是 实 模式 , 等 到 操作 系统 运行 起 来 以 后 就 切换 到 保护 模式 。 实 模式 只 能 访问 地 址 在 
IMB 以 下 的 内 存 ， 称 为 常规 内 存 ， 我 们 把 地 址 在 IMB 以 上 的 内 存 称 为 扩展 内 存 。 在 保护 模式 下 ， 
全 部 32 条 地 址 线 有 效 , 可 寻 址 高 达 4GB 的 物理 地 址 空间 ; 扩充 的 存储 器 分 段 管理 机 制 和 可 选 的 存 
储 器 分 页 管理 机 制 不 仅 为 存储 器 共享 和 保护 提供 了 硬件 支持 , 而 且 为 实现 虚拟 存储 器 提供 了 硬件 支 
持 ; 支持 多 任务 ， 能 够 快速 地 进行 任务 切换 (switch) 和 保护 任务 环境 (context) ; 4 个 特权 级 和 
完善 的 特权 检查 机 制 ， 既 能 实现 资源 共享 ， 又 能 保证 代码 和 数据 的 安全 和 保密 及 任务 的 隔离 。 
既然 讲 到 引导 程序 ， 这 里 顺便 介绍 一 下 ， 与 PC 不 同 的 是 ， 对 于 嵌入 式 Linux 系统 来 说 ， 并 没有 
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BIOS， 而 是 直接 从 Flash 中 运行 bootloader， 然 后 装载 内 核 ， 所 以 省 去 了 BIOS. ARRA Linux 的 


1.11 启动 内 核 


控制 权 转交 给 操作 系统 后 ,操作 系统 的 内 核 首 先 被 载 入 内 存 。 以 Linux 系统 为 例 ， 先 载 入 /boot 
目录 下 面 的 内 核 文件 。 内 核 加 载 成 功 后 ， 第 一 个 运行 的 程序 是 /sbin/init。 它 根据 配置 文件 (Debian 
系统 是 /etoinitab ) 产生 init 进程 。 这 是 Linux 启动 后 的 第 一 个 进程 ， 其 进程 号 PID) 为 1， 其 他 
进程 都 是 它 的 后 代 。 然 后 ，init 进程 加 载 系统 的 各 个 模块 ， 比 如 窗口 程序 和 网 络 程序 ， 直 至 执行 
/bin/login 程序 ， 跳 出 登录 界面 ， 等 待 用 户 输入 用 户 名 和 密码 。 至 此 ， 全 部 启动 过 程 完 成 。 


1.12. iAiR Shell 


Shell 俗称 壳 〈( 区 别 于 内 核 ) ， 是 用 户 使 用 Linux 的 接口 ， 用 户 输入 命令 后 ， 得 到 返回 结果 。 
Shell 可 以 分 为 图 形 CGUD Shell 和 命令 行 CCLI) Shell， 本 书 主要 讲解 命令 行 Shell。 
Linux 的 命令 行 Shell 有 两 种 工作 模式 。 


(1) 交互 模式 

在 交互 模式 下 , Shell 作为 命令 解释 器 的 角色 , 类 似 于 Windows XP 下 的 cmd.exe。 用 户 在 Linux 
终端 下 输入 的 每 一 个 命令 都 由 Shell 先 解释 ， 然 后 传 给 Linux 内 核 ， 内 核 再 调用 相应 的 系统 程序 后 
返回 结果 给 用 户 。 


(2) 非 交互 式 模式 

在 非 交互 式 模式 下 ，Shell 作为 脚本 语言 解释 器 的 角色 ,用 户 编写 一 个 脚本 文件 (如 .sh 文件 ) ， 
然后 在 命令 行 下 运行 该 脚本 文件 。 脚 本 语言 也 称 Shell 脚本 语言 ， 可 以 把 几 条 命令 放 在 一 起 ， 也 可 
以 定义 变量 ， 并 提供 许多 在 高 级 语言 中 才 具 有 的 控制 结构 ， 包 括 循环 和 分 支 等 。 反 正 就 是 自动 化 、 
批量 地 来 解释 命令 。 





1.13 常见 的 Shell 


不 同 的 Linux 系统 上 ，Shell 可 能 不 同 。 当 前 ， 使 用 较 广 的 Shell 有 标准 的 Bourne Shell Csh) ~ 
Korn Shell (ksh) 、C Shell (csh) 、Bourne Again Shell (bash) 等 。 本 书 使 用 的 Shell 是 bash。 我 
们 可 以 用 下 面 的 命令 来 查看 当前 环境 所 用 的 Shell: 


#echo SSHELL 


运行 结果 : H/bin/bash. 
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1.14 图 形 界 面 和 字符 界面 的 切换 


1.44.4. 在 不 退出 X-Window 的 情况 下 切换 到 字符 界面 


开机 默认 进入 的 是 图 形 界 面 ， 这 里 要 在 不 退出 图 形 界 面 的 情况 下 切换 到 字符 界面 。Linux 默认 
打开 7 个 屏幕 ， 编 号 为 ttyl~tty7。X-Window 启动 后 ， 占 用 的 是 tty7 号 屏幕 ，ttyl~tty6 仍 为 字符 界 
面 屏 幕 。 也 就 是 说 ， 用 Ctrl+AlttFn 组 合 键 即 可 实现 字符 界面 与 X-Window 界面 的 快速 切换 。 按 
Ctrl+Alt+Fn 只 是 切换 ， 并 不 退出 X-Window， 按 Ctrl+Alt+F7 或 AIt-F7 就 回 X-Window T o 

值得 注意 的 是 ,在 VMware 中 ,默认 情况 下 使 用 Ctrl+ Alt +Fn 是 不 起 作用 的 , 这 是 因为 VMware 
虚拟 操作 系统 和 宿主 操作 系统 之 间 的 鼠标 切换 热 键 是 Ctrl+Alt， 这 就 和 Ctrl+ Alt +Fn 发 生 冲突 了 ， 
所 以 我 们 要 修改 VMware 的 热 键 ， 打 开 VMware 菜单 项 Edit 一 Preference， 出 现 如 图 1-6 所 示 的 对 
话 框 。 


Hot key combination 


Sets the hot key combination used to ungrab from a virtual. 
machine and to perform other actions. 


O ctra 
© Cir Shtat 


O Custom. 


d). To send a key combination that includes Ctri+Shift+At 
iei to Mw qus, pron Chit SAk apaa ros 
thout releasing Ctri+Shift+Akt, and press 




















图 1-6 


把 Ctrl+Alt 改 为 Ctrl+ShittAlt， 然 后 单 击 OK 按钮 。 修 改 完毕 后 ， 需 要 重启 虚拟 机 的 操作 系统 。 
在 系统 图 形 界面 启动 后 ， 可 使 用 Ctrl+Alt+F1~F6 切换 到 字符 界面 ， 再 用 Ctrl+Altt+F7 切换 回 图 形 界 面 。 


1.14.2 ”强行 退出 X-Window 进入 文本 模式 


开机 默认 进入 的 是 图 形 界面 ， 退 出 图 形 界面 后 进入 字符 界面 。 首 先 在 图 形 界面 中 打开 一 
端 ， 然 后 输入 init 3 (注意 init 后 面 有 一 个 空格 ) 。 稍 后 系统 将 退出 图 形 界面 并 进入 字符 界面 。 用 
该 方法 切换 后 ， 图 形 界面 完全 关闭 。 如 果 图 形 界 面 中 有 文件 未 保存 ， 那 么 将 丢失 。 

用 init 5 可 以 回 到 图 形 界面 ， 但 原来 图 形 界面 中 的 进程 已 死 ， 而 且 需 要 重新 登录 。 
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1.14.3 设置 每 次 开机 进入 字符 界面 


安装 完 Linux 后 , 默认 进入 的 是 图 形 界面 , 我 们 现在 要 在 图 形 界面 下 修改 设置 , 使 得 以 后 开机 
直接 进入 字符 界面 ， 步 又 如 下 : 


(1) 在 图 形 界面 下 找到 文件 /etc/inittab， 然 后 右 击 ， 选 择 菜单 项 Open with "Text Editor”， 如 
图 1-7 所 示 。 


ES EE 
Hle Edit View Places Help 
































EX] P^] z 已 
hosts allow hosts deny initiog.conf 
[es issue issue net 
ga — Open with Other Application. D eic 
55 Bp cut E 
jwhol (P) copy d.so.cache Id so conf 
"i ER] Pa 
$. Make Link uu Lain 
** Rename d lese. 
idap libaudit conf libuser.conf 
B Move to Trash ra ue E 
Mem | am 
[ Create Archive. Ej p 
logrotate.conf trace conf | 
Properties 
pe 
mailrc maiicap man config mime types 





Det ittab" selected (1.6 KB) 











图 1-7 
(2) 在 /etc/inittab 中 找到 id:S:initdefault ， 如 图 1-8 所 示 。 
LA inittab (/etc) - gedit 70x 
Ele Edi View Search Jools Documents Help 
BE. QU à 9 5 DOB wv 
New Open ' Save Print Paste — Find Replace 
Dintab x 
# B 


4 Default runlevel. The runlevels used by RHS are: 
# ©- halt (Do NOT set initdefault to this) 

* 1 - Single user mode 

# 2 - Multiuser, without NFS (The same as 3, if you do not 
have networking) 

4 3 - Full multiuser mode 

# 4 - unused 

4 5-Xll 

4 6 - reboot (Do NOT set initdefault to this) 

# 

i 





d:5:initdefault:| 


# System initialization. 
Si::sysinit:/etc/rc.d/rc.sysinit 


10:0:wait:/etc/rc.d/rc 0 
l1:1:wait:/etc/rc.d/rc 1 

















[I 
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把 5 改 为 3， 然 后 保存 并 关闭 该 文件 。 


(3) 重启 Linux， 可 以 看 到 直接 进入 字符 界面 。 

“id:5:initdefault:” 的 意思 是 告诉 Linux 启动 时 运行 的 级 别 是 5， 也 就 是 图 形 模式 ， 改 成 3 就 是 
文本 模式 了 。 

这 是 因为 Linux 操作 系统 有 6 种 不 同 的 运行 级 (run leve) ， 在 不 同 的 运行 级 下 ， 系 统 有 着 不 
同 的 状态 ， 这 6 种 运行 级 说 明 如 下 。 


: 停机 。 记 住 不 要 把 initdefault 设置 为 0， 因为 这 样 会 使 Linux 无 法 启动 。 
单 用 户 模式 ， 就 像 Win9X 下 的 安全 模式 。 

多 用 户 ， 但 是 没有 NFS 。 

: 完全 多 用 户 模式 ， 标 准 的 运行 级 ， 字 符 界面 模式 。 

一 般 不 用 ， 在 一 些 特殊 情况 下 可 以 用 它 来 做 一 些 事情 。 

: X11， 即 进入 X-Window 系统 。 

: 重新 启动 。 记 住 不 要 把 initdefault 设置 为 6， 因 为 这 样 会 使 Linux 不 断 地 重新 启动 。 


1.144 ”从 字符 界面 进入 图 形 界面 

开机 默认 进入 的 是 字符 界面 ， 然 后 要 切换 到 图 形 界面 ， 方 法 是 在 字符 界面 下 输入 命令 “init 5”。 

通过 init 5 进入 图 形 界面 后 ,可 以 通过 Ctrl+Altt+Fn(n=1~6) 来 切换 到 字符 界面 、 通 过 Ctrl+Alt+F7 
切换 回 图 形 界面 。 

开机 进入 的 是 字符 界面 ， 相 当 于 运行 在 3 级 别 上 ， 通 过 init 5 切换 到 运行 级 别 5， 该 操作 会 启 
动 图 形 界面 相关 的 服务 ， 并 且 需 要 重新 输入 用 户 名 和 密码 后 登录 。 如 果 不 运行 init 5， 直 接 用 
Ctrl+Alt+F7 是 无 法 切换 成 功 的 ， 因 为 此 时 图 形 界 面 还 没有 启动 。 














E: 


eec 70909 
O^ wnbBRov5»-c 


1.15 Shell 命令 概述 


Shell 命令 也 就 是 俗称 的 Linux 命令 , 共有 2000 多 个 。 要 成 为 Linux 高 手 , 掌握 命令 是 必需 的 。 
如 果 要 把 Linux 下 的 命令 全 部 掌握 ， 那 么 恐怕 只 能 打击 初学 者 的 积极 性 了 。 所 以 ， 根 据 多 年 的 工作 
经 验 ， 在 2000 多 个 命令 中 精 选 出 几 百 个 常用 的 Shell 命令 ， 熟 练 掌握 这 些 常用 命令 后 ， 一 般 能 应 
付 大 多 数 工作 场合 ， 而 剩 下 的 命令 可 以 通过 帮助 (man) 来 解决 。 


1.16 ”环境 变量 


环境 变量 (environment variables) 通常 是 指 在 操作 系统 中 用 来 指定 操作 系统 运行 环境 的 一 些 变 
量 ， 比 如 PATH 变量 包含 一 系列 由 冒号 分 隔 开 的 目录 ， 系 统 就 从 这 些 目录 里 寻找 可 执行 文件 。 

在 Linux 中 , 环境 变量 分 为 系统 级 和 用 户 级 , 系统 级 的 环境 变量 是 每 个 登录 系统 的 用 户 都 要 读 
取 的 系统 变量 ， 而 用 户 级 的 环境 变量 则 是 该 用 户 使 用 系统 时 加 载 的 环境 变量 。 
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(1) 系统 级 环境 变量 

系统 级 环境 变量 存放 在 /etc/profile 文件 中 。 该 文件 是 用 户 登录 时 ， 操 作 系统 定制 用 户 环境 时 使 
用 的 第 一 个 文件 , 应 用 于 登录 到 系统 的 每 一 个 用 户 。 修 改 该 文件 中 的 环境 变量 将 作用 于 系统 的 每 个 
用 户 。 

查看 系统 级 环境 变量 的 命令 是 env, 大 家 可 以 在 命令 行 下 直接 运行 这 个 命令 来 查看 系统 级 环境 
变量 。 


(2) 用 户 级 环境 变量 

用 户 级 环境 变量 存放 在 各 个 用 户 的 ~/.bash_profile 文件 中 , ~ 表示 每 个 用 户 的 宿主 目录 (也 就 是 
home 目录 ) 。.bash_profile 是 一 个 隐 茂 文件， 我们 在 进入 ~ 后 ， 通 过 Is -a 可 以 看 到 该 文件 。 修 改 该 
文件 中 的 系统 变量 将 仅 影响 该 文件 对 应 的 用 户 。 

可 以 用 env 命令 来 显示 当前 用 户 的 环境 变量 。 
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2.1 准备 Linux 虚拟 机 


要 开发 Linux 程序 ， 前 提 是 需要 一 个 Linux 操作 系统 。 通 常 在 公司 的 开发 中 ， 都 会 有 一 台 专 门 
的 Linux 服务 器 供 员工 使 用 ， 而 我 们 自己 学 习 不 需要 这 样 ， 可 以 使 用 虚拟 机 软件 〈 比 如 VMware) 
来 安装 一 个 虚拟 机 中 的 Linux 操作 系统 。 

VMware 是 大 名 鼎鼎 的 虚拟 机 软件 ， 通 常 分 为 两 种 版 本 : 工作 站 版 本 CVMware Workstation) 
和 服务 器 客户 机 版 本 (VMware vSphere) 。 这 两 大 类 软件 都 可 以 安装 操作 系统 作为 虚拟 机 操作 系 
统 。 但 个 人 用 得 较 多 的 是 工作 站 版 本 , 供 单 个 人 在 本 机 使 用 。 服 务 器 客户 机 版 本 通常 用 于 企业 环境 ， 
供 多 个 人 远程 使 用 。 通 常 ， 我 们 把 自己 真实 PC 上 装 的 操作 系统 叫 宿主 机 系统 ，VMware 中 安装 的 
操作 系统 叫 虚拟 机 系统 。 

我 们 开发 Linux 程序 前 ， 通 常 先 在 虚拟 机 下 安装 Linux 操作 系统 ， 然 后 在 这 个 虚拟 机 的 Linux 
系统 中 编程 调试 ， 或 在 宿主 机 系统 (比如 Windows) 中 进行 编辑 ， 然 后 传 到 Linux 中 进行 编译 。 有 
了 虚拟 机 的 Linux 系统 , 开发 方式 的 灵活 性 比较 大 。 实际 上 , 不 少 一 线 开发 工程 师 都 是 在 Windows 
下 阅读 编辑 代码 ， 然 后 放 到 Linux 环境 中 编译 运行 的 ， 这 样 的 方式 效率 居然 还 不 低 。 

这 里 我 们 采用 的 虚拟 机 软件 是 VMware Workstation 10( 它 是 最 后 一 个 能 安装 32 位 操作 系统 的 
版 本 ) 。 在 安装 之 前 , 我 们 要 准备 Linux 安装 映像 文件 , 可 以 从 网 上 直接 下 载 Linux 操作 系统 的 ISO 
文件 ， 也 可 以 通过 UltralSO 等 软件 从 Linux 系统 光盘 制作 一 个 ISO 文件 ， 制 作 方法 是 在 菜单 上 选 
择 “ 工 具 ” 一 “制作 光盘 映像 文件 ”。 

建议 直接 从 网 上 下 载 一 个 ISO 文件 ， 这 样 更 加 简单 。 笔 者 就 从 Centos 官网 下 载 了 一 个 64 位 
的 Centos7.2.iso。 其 他 发 行 版 本 (如 RedHat, Debian, Ubuntu 或 Fedora 等 ) 也 可 以 作为 学 习 开发 
环境 。 

准备 好 ISO 文件 之 后 ， 就 可 以 通过 VMware 来 安装 Linux 了 。 打 开 VMware Workstation， 然 
后 根据 下 面 几 个 步骤 操作 即 可 。 





(1) 在 VMware 上 选择 菜单 New 一 Virtual Machine， 打 开 如 图 2-1 所 示 的 界面 。 
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Workstation 10 a) 








连接 远程 服务 器 
创建 新 的 虚拟 机 ü jJ 在 远程 服务 器 上 查看 和 管理 虚拟 机 。 
QQ 虚拟 化 物理 机 
| T. 从 现 有 物理 机 他 建 虚 握 机 。 


[EN nren 软件 更 新 
| O 检查 VMware Workstation 的 软件 更 新 。 


图 2-1 
单 击 “ 创 建新 的 虚拟 机 ”按钮 后 ， 出 现 如 图 2-2 所 示 的 对 话 框 。 
单 击 “ 下 一 步 ”按钮 ， 出 现 如 图 2-3 所 示 的 对 话 框 。 
xi x| 





3 m | 欢迎 使 用 新 建 虚拟 机 向 导 


您 第 望 使 用 什么 类 型 的 配置 ? 


J 
JBXLULT REG SEGRE Workstation 10.0 


3 e) 
SCSI PARAH. GANAN 
peit VMware 7* EE GTENEISUUROT. 
Rui. 


vmware 
Workstation 








图 2-2 图 2-3 


我 们 可 以 单 击 “ 浏 览 ” 按 钮 来 选择 ISO 文件 。 对 于 CentOS 7.2, VMware 10 并 不 会 自动 探测 
到 ,所 以 会 有 图 2-3 中 的 提示 。 不 必 管 它 ， 继 续 单 击 “ 下 一 步 ” 按 钮 ， 出 现 如 图 2-4 所 示 的 对 话 框 。 

选中 Linux， 并 在 “版 本 ”下 选择 “CentOS 64 位 ”， 因 为 我 们 要 安装 的 CentOS 7.2 是 64 位 
的 。 然 后 单 击 “ 下 一 步 ” 按 钮 ， 出 现 如 图 2-5 所 示 的 对 话 框 。 

















24 图 2-5 
我 们 可 以 在 “位 置 ”下 面 的 编辑 框 中 设置 虚拟 机 Linux 存放 的 目标 位 置 。 然 后 单 击 “ 下 一 步 ” 
按钮 ， 将 出 现 如 图 2-6 所 示 的 对 话 框 。 
这 个 对 话 框 可 以 设置 虚拟 机 Linux 系统 的 硬盘 容量 ， 默 认 是 20GB， 一 般 足够 使 用 ， 保 持 默 认 
设置 即 可 。 然 后 单 击 “ 下 一 步 ”按钮 ， 出 现 如 图 2-7 所 示 的 对 话 框 。 








图 2-6 图 2-7 


该 对 话 框 显 示 了 我 们 即将 要 安装 的 虚拟 机 的 配置 ， 就 像 去 电脑 城 装机 的 硬件 清单 一 样 。 单 击 
“完成 ”按钮 关闭 对 话 框 ， 此 时 会 回 到 VMware 主 界面 ， 单 击 “ 开 启 此 虚拟 机 ”， 如 图 2-8 所 示 。 
此 时 将 正式 开始 安装 CentOS. 7.2 操作 系统 。 安 装 过 程 比较 简单 ， 引 导 片 刻 后 ， 会 出 现 安装 向 导 ， 
第 一 步 是 选择 “语言 ”， 我 们 可 以 选择 “中 文 ”， 然 后 单 击 “ 下 一 步 ”按钮 ， 出 现 如 图 2-9 所 示 的 
页 面 。 
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REEARE 


CentOS 


[3] CentOS 64 位 


设备 
村 内存 1GB 
[3 处 理 器 1 
局 硬盘 (SCS1) 20GB 
jCD/DVD (IDE) — 正在 使 用 文件 K… 
Tamsma 














CENTOS 7 RR 


SECURITY 


SECURITY POLICY 
No profile selected. 


SER, RARRERNN 





ERO 
SEND 


软件 选择 (5) 
Bu 


KDUMP 
BEM Kcump. 











ECHO) 
xuamam 


网 络 和 主机 名 (N) 
Aut 


E 





图 2-9 


在 该 页 面 中 单 击 “ 软 件 选择 〈S) ”， 以 便 选择 要 安装 的 一 些 软 件 (尤其 是 编程 开发 类 的 软件 


包 ) 。 随 后 出 现 “ 软 件 选择 ”页 面 ， 如 图 2-10 所 示 。 





基本 环境 

mes 

基本 功能 

计算 节点 

执行 计算 及 处 理 的 安装 

基础 设施 服务 器 

用 于 操作 网 络 基础 设施 服务 的 服务 器 。 

文件 及 打印 服务 器 

用 于 企业 的 文件 、 打 印 及 存储 服务 器 。 

基本 网 页 服务 器 

提供 静态 及 动态 互联 网 内 容 的 服务 器 。 

典 拟 化 主机 

最 小 舟 拟 化 主机 

带 GUI 的 服务 器 

带 有 用 于 操作 网 络 基础 设施 服务 GUI 的 服务 器 

GNOME 桌面 

GNOME 是 一 个 非常 直观 且 用 户 友好 的 桌面 环境 . 

KDE Plasma Workspaces 

KDE Plasma Workspaces 是 一 个 高 度 可 配置 图 形 用 户 

界面 ， 其 中 包括 面板 、 和 桌面 、 系 统 图 标 以 及 桌面 向 导 和 
很多 功能 强大 
开发 及 生成 工作 站 
用 于 软件 、 硬 件 、 图 形 或 者 内 容 开发 的 工作 站 。 





















在 左边 “基本 环境 ”下 选中 “开发 及 生成 了 
LIA" 





“KDE” 和 “平台 开发 ”。 然 后 在 左上 角 单 击 “ 完 





选 环境 的 附加 选项 
Z 则 加 开发 
用 于 构建 开源 应 用 程序 的 附加 开发 标 头 及 程序 可 





WOEPW 
RISGSIESIR 280.55 BEHEUET BH OROES PCT RI. 
兼容 性 程序 库 

FE CERTI E LR Linux 的 之 前 版 本 中 构建 的 应 用 程序 
的 兼容 程序 库 





电子 邮件 服务 器 
RIFFI SMTP 和 (或 者 ) IMAP 电子 邮件 服务 
器 使 用 


Emacs 

GNU Emacs 可 扩展 、 可 自 定义 的 文本 编辑 器 。 

FTP 服务 器 

区 许 香 系统 作为 FTP 服务 器 使 用 
文件 及 存储 服务 器 

CIFS, SMB, NFS, iSCSI, iSER 及 iSNS 网 络 存储 服务 
器 。 
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[ 作 站 ”， 在 右边 选中 4 项 : 


“附加 开发 ”“ 开 发 
”按钮 ， 将 回 到 上 一 级 的 向 导 页 面 ， 














此 时 会 计算 要 安装 的 软件 包 之 间 的 依赖 关系 ， 稍 等 片刻 ， 等 右 下 角 的 “开始 安装 ” 变 为 高 亮 可 用 的 
时 候 , 说 明 已 经 准备 好 了 , 单 击 “ 开 始 安装 ”, 便 开 始 自动 安装 。 安 装 过 程 中 , 我 们 需要 设置 ROOT 


账户 的 密码 ， 如 图 2-11 所 示 。 
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ER CENTOS 7 安装 


Bio Help! 
CentOS 用 户 设置 
root Ea Q amru 
Root SBRRE an. 不 会 创建 任何 用 户 


C ramum 





'entOS Virtualization SIG 


rtualization in CentOS, virtualization of CentOS? 


stGroup 


图 2-11 
单 击 “ROOT 密码 ”会 出 现 设置 密码 的 页 面 ， 如 图 2-12 所 示 。 





root 帐户 用 于 管理 系统 。 为 root 用 户 输入 密码 。 
Root 3 (R) : | OED 


BC) DM 


O 您 输入 的 密码 强度 较 低 : 密码 未 通过 字典 检查 - 过 于 简单 化 /有 系统 化 . 再 次 单 击 完成 按钮 强 续 使 用 该 密码 。 
图 2-12 


这 里 输入 的 密码 是 “123456”， 由 于 太 简 单 了 ， 因 此 下 方 会 有 一 行 提示 ， 需 要 再 次 单 击 左上 
方 的 “完成 ”按钮 。 如 果 是 正式 场合 ， 建 议 设置 复杂 一 点 的 密码 ， 自 己 练习 时 ， 设 置 简单 一 点 也 没 
有 关系 。 单 击 2 次 左上 方 的 “完成 ”按钮 后 ，ROOT 账户 的 密码 设置 完毕 。 

稍 等 片刻 ， 安 装 完成 。 我 们 就 可 以 在 VMware 的 主 界面 中 开启 Linux 了 。 


2.2 连接 Linux 虚拟 机 


前 面 准备 好 了 Linux， 这 一 步 我 们 要 在 物理 机 器 的 Windows 操作 系统 (简称 宿主 机 ) 上 连接 
VMware 中 的 虚拟 机 Linux. (简称 虚拟 机 》， 以 便 传 送 文 件 和 远程 控制 编译 运行 。 基 本 上 ， 两 个 系 
统 能 相互 ping 通 就 算 连接 成 功 了 。 别 小 看 这 一 步 ， 有 时候 也 蛮 费 劲 的 。 下面 简单 介绍 一 下 VMware 
的 3 种 网 络 模式 ， 以 便 连 接 失 败 的 时 候 可 以 尝试 去 修复 。 

VMware 虚拟 机 网 络 模式 就 是 虚拟 机 操作 系统 和 宿主 机 操作 系统 之 间 的 网 络 拓扑 关系 , 通常 有 
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3 种 模式 : 桥接 模式 、 主 机 模式 、NAT 模式 。 这 3 种 网 络 模式 都 通过 一 台 虚 拟 交换 机 和 主机 通信 。 
默认 情况 下 ， 桥 接 模式 下 使 用 的 虚拟 交换 机 是 VMnet0， 主 机 模式 下 使 用 的 虚拟 交换 机 为 VMnetl, 
NAT 模式 下 使 用 的 虚拟 交换 机 为 VMnet8。 如 果 需 要 查看 、 修 改 或 添加 其 他 虚拟 交换 机 ， 可 以 打开 
VMware， 然 后 选择 主 菜单 中 的 “编辑 ”一 “虚拟 网 络 编辑 器 ”， 此 时 会 出 现 “虚拟 网 络 编辑 器 ” 
对 话 框 ， 如 图 2-13 所 示 。 


Q ER x 












类 型 外 部 连接 主机 连接 DHCP 子 网 地 址 
桥接 模式 Realtek PCIe GBE Family Co. 
REN.. - 

NAT 模式 NAT 模 式 





已 启用 192.168.224.0 
已 启用 192.168.234.0 


AMPO.. 移 除 由 络 (9) 











YMnet 信息 
@ 桥接 模式 (将 虚拟 机 直接 连接 到 外 部 网 络 XB) 

桥接 用 (DD: Realtek PCIe GBE Family Controller #2 v| BERE... 
OmaT 模式 (与 虚拟 机 共享 主机 的 I 地 址 XN) NAT 设置 (3),,， 
口 仅 主机 模式 (在 专用 网 络 内 连接 虚拟 机 XH) 

将 主机 虚拟 适配器 连接 到 此 网 络 (J) 

机 虚拟 适配器 各 和 配器 
使 用 本 地 DHCP 服务 将 TP 地 址 分 配给 虚拟 机 (D) DHCP 设置 (Q),， 
[ ] Fes: [ ] 

恢复 默认 设置 (R) 取消 应 用 (A) 帮助 





图 2-13 


默认 情况 下 , VMware 也 会 为 主机 操作 系统 安装 两 块 虚拟 网 卡 , 分 别 是 VMware Virtual Ethemet 
Adapter for VMnetl 和 VMware Virtual Ethernet Adapter for VMnet8， 看 名 字 就 知道 ， 前 者 用 来 和 虚 
拟 交 换 机 VMnetl 相连 ， 后 者 用 来 连接 VMnet8。 我 们 可 以 在 主机 系统 的 “控制 面板 ”一 “网 络 和 
Internet” 一 “网 络 连接 ”下 看 到 这 两 块 网 卡 。 有 读者 可 能 会 问 ， 在 虚拟 交换 机 VMnet0 中 ， 为 什么 
主机 系统 里 没有 虚拟 网 卡 去 连接 呢 ? 这 个 问题 好 , 其 实 VMnet0 虚拟 交换 机 所 建立 的 网 络 模式 是 桥 
接 网 络 〈 桥 接 模式 中 的 虚拟 机 操作 系统 相当 于 宿主 机 所 在 网 络 中 的 一 台独 立 主机 ) ， 所 以 主机 直接 
用 物理 网 卡 去 连接 VMnet0。 
值得 注意 的 是 ， 这 3 种 虚拟 交换 机 都 是 默认 就 有 的 ， 我 们 也 可 以 自己 添加 更 多 的 虚拟 交换 机 
(图 2-13 中 的 “添加 网 络 ” 按 钮 便 起 这 样 的 作用 ) 。 如 果 添 加 的 虚拟 交换 机 的 网 络 模式 是 主机 模 
式 或 NAT 模式 ， 那 么 VMware 也 会 自动 为 主机 系统 添加 相应 的 虚拟 网 卡 。 接 下 来 我 们 具体 阐述 
VMware 的 3 种 网 络 模式 或 称 架构 ) 。 本 书 中 的 宿主 机 和 虚拟 机 是 通过 桥接 模式 连接 的 。 


2.2.4. 通过 桥接 模式 连接 虚拟 机 


桥接 (或 称 网 桥 ) 模式 是 指 宿主 机 操作 系统 的 物理 网 卡 和 虚拟 机 操作 系统 的 网 卡通 过 VMnet0 
虚拟 交换 机 进行 桥接 ， 物 理 网 卡 和 虚拟 网 卡 在 拓扑 图 上 处 于 同等 地 位 ， 网 桥 模 式 使 用 VMnet0 虚拟 
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交换 机 。 桥 接 模式 下 的 网 络 拓扑 如 图 2-14 所 示 。 
知道 原理 后 ， 下 面具 体 设置 一 下 桥接 模式 ， 使 得 宿主 机 和 虚拟 机 相互 ping 通 。 过 程 如 下 : 


(1) 打开 VMware， 然 后 单 击 CentOS 7.2 的 “编辑 虚拟 机 设置 ”， 如 图 2-15 所 示 。 








VMware 为 虚拟 机 分 配 的 虚拟 网 卡 
EX 
=i 
— — . . 
| 585 neo 
-一 . 
| 号 centos7.2 64 位 
REN ON 
宿主 机 s r LN y vo EKA v 
宿主 机 物理 网 卡 一 人 人 “as -58 
宿主 机 连接 的 以 太 网 mny 
图 2-14 图 2-15 


注意 ， 此 时 虚拟 机 CentOS 7.2 要 处 于 关机 状态 ， 即 “编辑 虚拟 机 设置 ”上 面 的 文字 是 “开启 
此 虚拟 机 ”， 说明 虚 拟 机 是 关机 状态 。 通 常 ， 对 虚拟 机 进行 设置 最 好 是 在 虚拟 机 的 关机 状态 ， 比 如 
更 改 内 存 大 小 等 。 不 过 ， 如 果 只 是 配置 网 卡 信息 ， 也 可 以 在 开启 虚拟 机 后 再 进行 设置 。 


(2) 单 击 “ 编 辑 虚拟 机 设置 ”后 ， 将 弹出 “虚拟 机 设置 ”对 话 框 ， 在 该 对 话 框 左边 选中 “网 络 适 
配器 ”， 在 右边 选择 “桥接 模式 ”， 并 选中 “复制 物理 网 络 连 接 状 态 ” 复 选 框 ， 如 图 2-16 所 示 。 

















2-16 
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然后 单 击 “确定 ”按钮 ， 接 着 开启 此 虚拟 机 。 


(3) 设置 桥接 模式 后 ，VMware 的 虚拟 机 操作 系统 就 像 是 局 域 网 中 一 台独 立 的 主机 ， 相 当 于 
物理 局 域 网 中 的 一 台 主 机 。 它 可 以 访问 网 内 任何 一 台 机 器 。 在 桥接 模式 下 ，VMware 的 虚拟 机 操作 
系统 的 IP 地 址 、 子 网 掩 码 可 以 手工 设置 ， 而 且 要 和 宿主 机 器 处 于 同一 网 段 ， 这 样 虚拟 系统 才能 和 
宿主 机 器 进行 通信 ,如 果 要 上 因特网 , 还 需要 自己 设置 DNS 地 址 。 当然 , 更 方便 的 方法 是 从 DHCP 
服务 器 处 获得 IP. DNS 地 址 (我 们 的 家 庭 路 由 器 通常 里 面包 含 DHCP 服务 器 ， 所 以 可 以 自动 获取 
IP 和 DNS 等 信息 ) 。 


在 虚拟 机 CentOS 7.2 中 打开 终端 窗口 (可 以 在 桌面 上 右 击 ， 然 后 在 快捷 菜单 中 选择 “在 终端 
中 打开 ”) ， 然 后 在 终端 窗口 (后 面 简称 终端 中 输入 查看 网 卡 信息 的 命令 ifconfig: 





root@localhost 桌面 ]# ifconfig 

enol6777736: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 

inet 192.168.1.8 netmask 255.255.255.0 broadcast 192.168.1.255 
inet6 fe80::20c:29ff:febf:8054 prefixlen 64 scopeid 0Ox20«link» 
ether 00:0c:29:bf:80:54 txqueuelen 1000 (Ethernet) 

RX packets 3 bytes 553 (553.0 B) 

RX errors 0 dropped 0 overruns 0 frame 0 

TX packets 27 bytes 3871 (3.7 KiB) 

TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 


其 中 , eno16777736 是 笔者 虚拟 机 CentOS 7.2 中 的 一 块 网 卡 名 称 , 我 们 可 以 修改 其 配置 文件 来 
设置 新 的 网 卡 配 置信 息 。 在 终端 下 输入 : 


# vi /etc/sysconfig/network-scripts/ifcfg-eno16777736 
vi 是 字符 模式 下 的 文本 编辑 命令 ， 如 果 要 可 视 化 编辑 ， 可 以 用 gedit 编辑 器 ， 命 令 就 变 为 : 
# gedit /etc/sysconfig/network-scripts/ifcfg-eno16777736 


ifcfg-eno16777736 是 网 卡 eno16777736 的 配置 文件 , 假设 宿主 机 Windows 的 IP 是 192.168.1.0 
网 段 的 ， 我 们 对 其 进行 如 下 修改 。 


TYPE=Ethernet 

BOOTPROTO-dhcp ”# 表 示 IP/DNS 等 信息 从 DHCP 服 务 器 获取 

*IPADDR-192.168.1.8 #IP 地 址 ， 这 里 注释 掉 不 设置 ， 如 果 BOOTPROTO 是 static， 就 要 设置 
#NETMASK=255.255.255.0 ”# 掩 码 ， 这 里 注释 掉 不 设置 ， 如 果 BOOTPROTO 是 static， 就 要 设置 
DEFROUTE=yes 

PEERDNS=yes 

PEERROUTES=yes 

IPV4 FAILURE FATAL-no 

IPV6INIT-yes 

IPV6 AUTOCONF-yes 

IPV6 DEFROUTE-yes 

IPV6 PEERDNS-yes 

IPV6 PEERROUTES-yes 

I PV6 FAI LURE FATAL-no 
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NAME-eno16777736 
UUID-51324e46-7b41-40bf-b244-8b80d05f400c 
DEVICE-enol6777736 

ONBOOT-yes “# 开 启 自动 使 用 该 配置 


然后 保存 后 退出 。 接 着 重启 网 络 服务 ， 以 生效 刚才 的 配置 : 

#service network restart 

此 时 ， 查 看 网 卡 eno16777736 的 IP， 发 现 已 经 是 新 的 IP 地 址 了 ， 此 时 在 虚拟 机 Linux 和 宿主 
机 Windows 可 以 相互 ping 通 了 如果 没有 ping 通 ， 可 能 Windows 中 的 防火 墙 开 着 ， 可 以 把 它 关 
闭 ) 。 此 外 ， 在 虚拟 机 中 ， 用 火狐 上 网 也 可 以 打开 网 页 了 ， 如 图 2-17 所 示 。 


六 应 用 程序 -位置 ~ Ba- 


Hoe200* O~ 





SR 


REX x 


[BI oot Glocalhost:=/ sti @ xus 中 国 高 贷 赦 买 记者 为 哈 .， | 1/4 9 


图 2-17 


至 此 ， 桥 接 模式 下 的 DHCP 方式 已 经 可 以 和 宿主 机 相互 通信 了 。 如 果 要 在 桥接 模式 下 通过 静 
态 IP 方式 让 虚拟 机 和 宿主 机 相互 访问 ， 虚 拟 机 IP 地 址 就 需要 与 宿主 机 IP 在 同一 个 网 段 ， 掩 码 要 
一 样 ， 如 果 需 要 联 Internet， 网 关 与 DNS 就 需要 与 宿主 机 的 网 卡 一 致 ， 限 于 篇 幅 ， 这 里 不 袭 述 了 。 


2.2.2 主机 模式 


VMware 的 Host-Only( 仅 主机 模式 ) 就 是 主机 模式 。 默 认 情况 下 ， 物 理 主机 和 虚拟 机 都 连 在 
虚拟 交换 机 VMnetl E, VMware 为 主机 创建 的 虚拟 网 卡 是 VMware Virtual Ethernet Adapter for 
VMnetl1， 主 机 通过 该 虚拟 网 卡 和 VMnetl 相连 。 主 机 模式 将 虚拟 机 与 外 网 隔 开 ， 使 得 虚拟 机 成 为 
一 个 独立 的 系统 ， 只 与 主机 相互 通信 。 当 然 ， 主 机 模式 下 也 可 以 让 虚拟 机 连接 因特网 ， 方 法 是 将 主 
机 网 卡 共享 给 VMware Network Adapter for VMnetl 网 卡 ， 从 而 达到 虚拟 机 联网 的 目的 。 但 一 般 主 
机 模式 都 是 为 了 和 物理 主机 的 网 络 隔 开 ， 仅 让 虚拟 机 和 主机 通信 。 
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2.2.3 ”通过 NAT 模式 连接 虚拟 机 


NAT (Network Address Translation， 网 络 地 址 转换 ) 模式 也 是 VMware 创建 虚拟 机 的 默认 网 
络 连 接 模式 。 使 用 NAT 模式 连接 网 络 时 ，VMware 会 在 宿主 机 上 建立 单独 的 专用 网 络 ， 用 以 在 主 
机 和 虚拟 机 之 间 相 互通 信 。 虚 拟 机 向 外 部 网 络 发 送 的 请 求 数据 将 被 “ 包 里 ”， 交 由 NAT 网 络 适 配 
器 加 上 “特殊 标记 ”并 以 主机 的 名 义 转发 出 去 ， 外 部 网 络 返回 的 响应 数据 将 被 拆 “ 包 于 ”， 也 是 先 
由 主机 接收 ， 然 后 交 由 NAT 网 络 适配器 根据 “特殊 标记 ”进行 识别 并 转发 给 对 应 的 虚拟 机 ， 因 此 
虚拟 机 在 外 部 网 络 中 不 必 具 有 自己 的 TP 地 址 。 从 外 部 网 络 来 看 , 虚拟 机 和 主机 在 共享 一 个 IP 地 址 ， 
默认 情况 下 ， 外 部 网 络 终端 也 无 法 访问 到 虚拟 机 。 

此 外 ， 在 一 台 宿 主机 上 只 允许 有 一 个 NAT 模式 的 虚拟 网 络 。 因 此 ， 同 一 台 宿 主机 上 的 多 个 采 
用 NAT 模式 连接 网 络 的 虚拟 机 也 是 可 以 相互 访问 的 。 

设置 虚拟 机 NAT 模式 的 过 程 如 下 : 


(1) 设置 虚拟 机 ,使 得 网 卡 的 网 络 连接 模式 为 NAT 模式 , 然后 单 击 “ 确 定 ”按钮 ， 如 图 2-18 
所 示 。 











图 2-18 


(2) 编辑 网 卡 配 置 文件 ， 设 置 以 DHCP 方式 获取 IP。 具 体 步 又 和 2.2.1 节 的 相同 。 如 果 大 家 
以 前 已 经 编辑 网 卡 为 DHCP 方式 获取 IP， 这 一 步 可 以 不 做 ,保持 默认 即 可 。 


此 时 ,就 可 以 和 宿主 机 相互 ping 通 (如果 没有 ping 通 ， 可 能 Windows 中 的 防火 墙 开 着 , 可 以 
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把 它 关 闭 ) ， 并 且 可 以 在 虚拟 机 中 上 网 浏览 网 页 了 。 
NAT 模式 也 很 简单 。 大 家 也 可 以 在 虚拟 机 中 用 ifconfig 命令 看 一 下 IP: 
[rootQlocalhost 桌面 ]# ifconfig 


enol6777736: flags=4163<UP, BROADCAST, RUNNING,MULTICRAST> mtu 1500 
inet 192.168.80.128 netmask 255.255.255.0 broadcast 192.168.80.255 


可 以 看 到 虚拟 机 IP 为 192.168.80.128， 这 个 IP 是 从 哪里 获取 的 呢 ? 和 桥接 模式 不 同 ， 这 个 IP 

不 是 从 家 庭 路 由 器 处 获得 的 ， 而 是 从 虚拟 交换 机 VMnet8 处 获得 的 。 打开 VMware 界面 ， 选 择 主 菜 

单 中 的 “编辑 ”一 “虚拟 网 络 编辑 器 ”， 打 开 “ 虚 拟 网 络 编辑 器 ”对 话 框 ， 并 选择 VMnet8， 可 以 
看 到 其 子 网 IP 为 192.168.80.0， 如 图 2-19 所 示 。 

xi 
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Cw ] s» ERE) um 


图 2-19 


然后 单 击 “ 确 定 ”按钮 ， 此 时 所 有 连接 到 虚拟 交换 机 VMnet8 上 的 主机 都 将 动态 获得 
192.168.80.x 这 样 的 IP 地 址 。 我 们 可 以 到 宿主 机 Windows (LA Windows 7 系统 为 例 说 明 ， 其 他 
Windows 系统 类 似 ) 下 查看 连接 到 VMnet8 上 的 虚拟 网 卡 VMware Virtual Ethernet Adapter for 
VMnet8,， 进 入 “控制 面板 ”一 “网 络 和 Internet” 一 “网 络 连接 ”, 然后 右 击 VMware Virtual Ethernet 
Adapter for VMnet8， 打 开 其 属性 对 话 框 ， 选 中 “Internet 协议 版 本 4”， 然 后 单 击 “ 属 性 ”按钮 ， 
可 以 看 到 该 网 卡 的 IP 是 192.168.80.1, 这 个 IP 也 是 VMnet8 动态 分 配 的 。 此 时 , 在 Windows 下 ping 
虚拟 机 Linux， 可 以 发 现 能 ping 通 了 ， 如 图 2-20 所 示 。 
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2.3 ”通过 终端 工具 连接 Linux 虚拟 机 


安装 完毕 虚拟 机 的 Linux 操作 系统 后 ， 我 们 就 要 开始 使 用 它 了 。 怎 么 使 用 呢 ? 通常 都 是 在 
Windows 下 通过 终端 工具 (比如 SecureCRT) 来 操作 Linux。 这 里 我 们 使 用 SecureCRT 后面 简 称 
CRT) 终端 工具 来 连接 Linux， 然 后 在 CRT 窗口 下 以 命令 行 的 方式 使 用 Linux。 该 工具 既 可 以 通过 
安全 加 密 的 网 络 连接 方式 (SSH) 来 连接 Linux， 也 可 以 通过 串口 的 方式 来 连接 Linux， 前 者 需要 
知道 Linux 的 IP 地 址 ， 后 者 需要 知道 串口 号 。 除 此 以 外 ， 还 能 通过 Telnet 等 方式 ， 大 家 可 以 在 实 
践 中 慢 慢 体会 。 

虽然 操作 界面 也 是 命令 行 方式 ， 但 是 比 Linux 自己 的 字符 界面 方便 得 多 ， 比 如 CRT 可 以 打开 
多 个 终端 窗口 、 可 以 使 用 鼠标 等 。SecureCRT 软件 是 Windows 下 的 软件 ， 可 以 在 网 上 免费 下 载 到 。 
下 载 安装 就 不 歼 术 了， 大 家 可 以 根据 自己 的 Windows 版 本 (32 位 还 是 64 位 ) 来 下 载 相 应 的 版 本 ， 
然后 进行 安装 ， 或 直接 使 用 免 安 装 的 绿色 版 本 。 这 里 使 用 的 是 绿色 版 的 64 位 
SecureCRTSecureFX_HH_x64_7.0.0.326。 我 们 通过 一 个 例子 来 说 明 如 何 连接 虚拟 机 Linux 。 


【 例 2.1】 使 用 SecureCRT 连接 虚拟 机 Linux 
(1) 打开 SecureCRTPortable, 在 工具 栏 上 单 击 “连接 ”按钮 或 直接 按 快捷 键 AlttC, 如 图 2-21 









所 示 。 
出 现 “ 连 接 ” 对 话 框 ， 单 击 工具 栏 上 的 “新 建 会 话 ” 按 钮 ， 如 图 2-22 所 示 。 
EE 
文件 人 F) REE 查看 人 ”选项 0) A WEE 
gy SJ o £3 33 6 tE Ee Ei] 





图 2-21 


此 时 出 现 “ 新 建 会 话 向 导 ” 对 话 框 ， 如 图 2-23 所 示 。 
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(2) 在 “新 建 会 话 向 导 ” 对 话 框 中 ， 选 中 SecureCRT 协议 : SSH2， 然 后 单 击 “ 下 一 步 ” 按 
钮 ， 接 着 输入 主机 名 “192.168.80.128”， 用 户 名 “root” 这 个 IP 就 是 我 们 前 面 安装 的 虚拟 机 Linux 
的 IP，root 是 Linux 的 超级 用 户 账户 。 输 入 完毕 后 如 图 2-24 所 示 。 
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et nana Ir NE 
: 


图 2-24 


单 击 “下 一 步 ”按钮 ， 接 着 选中 SecureFX 协议 : SFTP， 如 图 2-25 Wiz. SecureFX 是 宿主 机 
和 虚拟 机 之 间 传 输 文件 的 软件 ， 采 用 的 协议 可 以 是 SFTP (安全 的 FTP 传输 协议 ) 、FTP、SCP 等 。 


C IH 
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图 2-25 


单 击 “ 下 一 步 ”按钮 ， 接 着 可 以 重 命名 会 话 的 名 称 ， 也 可 以 保持 默认 ， 即 用 IP 作为 会 话 名 称 ， 
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最 后 单 击 “完成 ”按钮 ， 如 图 2-26 所 示 。 
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图 2-26 
此 时 ， 我 们 可 以 看 到 “连接 ”对 话 框 中 出 现 了 我 们 刚才 建立 的 会 话 ， 如 图 2-27 所 示 。 


G) 在 “连接 ”对 话 框 中 单 击 “ 连 接 ” 按 钮 ， 正 式 进入 终端 窗口 ， 此 时 还 会 提示 需要 输入 root 
的 密码 ， 如 图 2-28 所 示 。 
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图 2-27 图 2-28 
输入 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 就 到 了 熟悉 的 Linux 命令 提示 符 下 了 ， 如 图 2-29 所 示 。 







EEE ioj xj 
RED 0) fc [M3 工具 0) gno) 帮助 00 
FEME. TIE aaa uw 721 


|^7182.168.80.128 x | 











» 
[=] 



































l f, 62 5i|vrico 
图 2-29 


SecureCRT 正式 连接 成 功 ， 可 以 通过 命令 来 使 用 Linux 了 。 
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24 搭建 Linux 下 的 C++ 开发 环境 


Linux 下 的 C++ 开发 就 是 开发 过 程 〈 编 辑 、 编 译 、 连 接 ) 全 部 在 Linux 下 完成 。 通 常 有 两 种 方 
式 , 一 种 是 编辑 、 编 译 、 调 试 分 开 称 为 命令 开发 方式 ) ; 另 一 种 是 编辑 、 编 译 、 调 试 在 一 个 集成 
开发 环境 中 完成 ， 称 为 集成 开发 方式 。 

在 命令 开发 方式 下 ,编辑 源 代码 的 工具 可 以 使 用 图 形 界面 下 的 编辑 器 gedit 或 字符 界面 下 的 编 
辑 器 vi/vim。 编 辑 完毕 后 保存 ， 然 后 在 命令 行 下 使 用 命令 gcc/g++ 编 译 程序 ， 如 果 需 要 调用 ， 可 以 
使 用 gdb 命令 。 这 两 种 方式 稍 显 哩 唆 ， 尤 其 是 调试 ， 只 能 在 命令 行 下 用 gdb 进行 调试 ， 效 率 不 是 很 
高 ,但 这 是 Linux 开发 人 员 的 基本 功 。 

集成 开发 方式 就 是 在 图 形 界面 的 Linux 下 使 用 C++ 集成 开发 环境 ， 比 如 Eclipse CDT。 这 种 方 
式 比较 方便 ， 比 如 可 以 用 鼠标 把 工程 管理 、 编 辑 、 编 译 和 调试 工作 都 在 一 个 集成 开发 环境 下 完成 。 
这 种 开发 方式 效率 较 高 ， 但 不 是 每 个 企业 都 会 提供 Linux 图 形 界面 。 

既然 这 里 讲 到 了 图 形 界 面 和 字符 界面 ,就 顺便 介绍 一 下 图 形 界 面 和 字符 界面 的 切换 。 在 CentOS 
7.2 F, 如 果 当 前 是 图 形 界面 , 可 以 使 用 组 合 键 Ctrl+Altt+F2 切换 到 字符 界面 ; 如 果 当 前 是 字符 界面 ， 
就 可 以 使 用 CtrlHAltt+F1 切换 到 图 形 界 面 。 


2.4.1 非 集成 开发 方式 

在 非 集成 开发 方式 下 ， 编 辑 、 编 译 、 调 试 分 别 使 用 不 同 的 工具 。 常 用 的 编辑 器 有 gedit 和 vi. 
gedit 需要 在 图 形 界面 下 使 用 ， 可 以 使 用 鼠标 。 大 名 鼎鼎 的 vi 通常 在 字符 界面 下 使 用 ， 关 于 该 编辑 
器 的 详细 使 用 方式 ， 我 们 会 在 后 面 章 节 中 阐述 。 很 多 Linux 操作 系统 〈( 比 如 服务 器 操作 系统 、 顽 入 
式 系统 等 ) 都 会 提供 vi 编辑 器 ， 而 其 他 编辑 器 则 有 可 能 不 提供 ， 所 以 必须 要 学 会 vi。 

在 Linux 下 ， 通 常 使 用 gcc 或 g++ 来 编译 源 代 码 程序 。 如 果 要 调试 ， 也 是 在 命令 行 下 输入 命令 
gdb。 这 两 个 工具 都 会 在 后 面 章节 中 冰 述 。 下 面 开始 完成 我 们 的 “Hello World” 程 序 。 


【 例 2.2】 通 过 gedit 编辑 源 代码 并 编译 生成 第 一 个 C++ 程序 


(1) 打开 VMware， 启 动 Linux， 然 后 以 root 账户 登录 图 形 界 面 。 
(2) 在 桌面 上 右 击 ， 在 快捷 菜单 上 选择 “在 终端 中 打开 ”， 接 着 在 命令 提示 符 下 输入 gedit: 





[roote@localhost 桌面 ]# gedit 
稍 等 片刻 ， 将 会 出 现 gedit 编辑 窗口 ， 在 窗口 中 输入 的 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main(int argc, char *argv[]) 
t 
char sz[] = "Hello, World!"; 
cout «« sz «« endl; 
return 0; 
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代码 很 简单 ， 前 面包 含 头 文件 、 引 用 命名 空间 std, 这 是 为 了 使 用 cout. 然后 定义 了 main 函数 ， 
并 在 里 面 定 义 了 字符 串 及 输出 语句 。 
单 击 gedit 的 保存 按钮 〈 在 右上 方 ) ， 然 后 定位 到 桌面 〈 或 其 他 路 径 ) ， 接 着 输入 保存 的 文件 


名 testcpp。 
G) 开始 编译 链接 。 返 回 到 终端 窗口 ， 进 入 test.cpp 所 在 目录 ， 然 后 输入 命令 进行 编译 链接 : 
[rootQ@localhost 桌面 ]# g++ -o test test.cpp 
再 运行 生成 的 test 程序 : 
[rootélocalhost 桌面 ]# ./test 
Hello, World! 
我 们 可 以 看 到 test 程序 输出 了 “Hello, World!" . 
g++ 是 编译 C++ 程序 的 编译 工具 ，-o 是 输出 生成 二 进 制程 序 的 意思 ， 其 后 面 紧 跟 生成 二 进 制程 
序 的 名 称 。 
【 例 2.3】 通 过 vi 编辑 源 代码 并 编译 生成 第 二 个 C++ 程 序 
CD 进入 图 形 界面 的 Linux， 打 开 终 端 窗口 ， 或 者 进入 字符 界面 的 命令 行 。 
(2) 在 命令 行 提示 符 下 ， 运 行 vi 或 vim 编辑 命令 ， 然 后 输入 【 例 2.2】 同 样 的 代码 。 接 着 使 
用 wq 命令 保存 为 test.cpp 并 退出 vi。 
OD 在 命令 行 提示 符 下 运行 编译 链接 命令 : 
[rootGlocalhost 桌面 ]# g++ -o test test.cpp 
再 运行 生成 的 test 程序 : 


[rootQ@localhost 桌面 ]# ./test 
Hello, World! 


我 们 可 以 看 到 test 程序 输出 了 “Hello, World!”。 


2.4.2 ”集成 开发 方式 


我 们 开发 一 个 程序 ， 基 本 过 程 是 先 编辑 源 代码 ， 然 后 对 其 进行 编译 、 运 行 、 调 试 。 如 果 能 

这 些 工 作 放 在 一 个 软件 里 进行 ， 将 会 很 方便 ， 再 加 上 工程 管理 ， 那 么 简直 完美 了 。 集 成 开发 环境 
QDE) 就 是 用 来 做 这 项 工作 的 。Linux 下 的 集成 开发 环境 也 有 不 少 ， 最 著名 的 莫 过 于 Eclipse. iX 
工具 不 仅 可 以 开发 Java 程序 , 还 有 专门 用 来 开发 C/C++ 程序 的 Eclipse 版 本 CDT。 如 果 开 发 的 环境 
是 图 形 界面 的 Linux 操作 系统 ， 建 议 使 用 Eclipse 来 开发 程序 。 

Eclipse 可 以 从 官方 网 站 (http://www.eclipse.org/downloads/eclipse-packages/) 下 载 。 打 开 网 页 ， 
然后 在 右上 方 选择 Linux， 这 是 因为 我 们 要 下 载 的 是 Linux 系统 下 的 Eclipse。 然 后 在 当前 页 面 上 找 
到 Eclipse IDE for C/C++ Developers， 并 在 旁边 单 击 “64 bit” 进 行 下 载 。 因 为 CentOS 7.2 是 64 位 
操作 系统 ， 所 以 选择 下 载 64 位 的 Eclipse 。 下 载 后 是 一 个 压缩 文件 
eclipse-cpp-oxygen-1a-linux-gtk-x86_64.tar.gz， 可 以 把 它 拖 忠 到 虚拟 机 Linux 下 ,然后 右 击 ， 进 行 解 
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压 。 解 压 后 会 在 








同 路 径 下 生成 一 个 文件 夹 Eclipse， 进 入 该 文件 夹 ， 里 面 有 一 个 可 执行 程序 eclipse; 








双击 便 可 启动 。 


因为 是 Java 程序 ， 所 以 启动 过 程 有 点 慢 。 启 动 过 程 中 会 有 一 个 启动 图 片 显示 在 屏 





幕 中 央 ， 如 图 2-30 所 示 。 











图 2-30 


启动 过 程 中 会 让 用 户 选择 工作 空间 〈 或 叫 工作 区 ， 就 是 存放 工程 的 地 方 ) ， 如 图 2-31 所 示 。 


Eclipse Launcher x 


Select a directory as workspace 


Eclipse uses the workspace directory to store its preferences and development artifacts. 





Workspace: | /root/eclipse-workspace ~ Browse... 





Use this as the default and do not ask again 


Cancel Launch 





图 2-31 


如 果 不 想 每 次 启动 都 出 现 该 对 话 框 ， 可 以 在 对 话 框 的 左下 角 选 中 Use this as the default and do 
not ask again 。 这 里 说 明 一 下 Eclipse 对 工程 的 管理 。Eclipse 的 基本 工程 目录 叫 作 workspace， 每 个 


运行 时 的 Eclipse 实例 只 能 对 应 一 个 workspace， 即 workspace 是 当前 工作 的 根 目录 。 我 们 在 





workspace 中 可 以 创建 一 个 或 多 个 C/C++ 工 程 。 这 里 保持 默认 的 工作 空间 ， 即 路 径 为 
/rooteclipse-workspace。 单 击 Launch 按钮 ， 进 入 Eclipse 的 主 界面 ， 如 图 2-32 所 示 。 
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edipse-workspace ~ Eclipse 





File Edit Source Refactor Navigate Project Search Run Widow Help 
mise -&vT-i-4-5-(4-g- $-:8ivit-0O-9-Q-io?-5 

Ey Ve Quick Acce: 8 mel 
Its Project Explorer 3 75 "B |EOos| * Tow] 


An outline is not available. 


I: Problems 3 Æ Tasks EJ Console C Properties Hf Call Graph p Ee 
O items 
Description Re 


ourc Path Location 





图 2-32 





现在 我 们 要 新 建 一 个 C++ 工程 。 
【 例 2.4】 第 一 个 Eclipse C++ 程序 


(1) 打开 Eclipse。 


(2) 在 主 界面 上 单 击 菜单 File 一 New 一 C++ Project， 然 后 会 出 现 C++ 工程 向 导 对 话 框 ， 
如 图 2-33 所 示 。 





C++ Project B 
C++ Project — 
Create C++ project of selected type Im 
Project name: | Test 

V! Use default location 

| 
Location: | /root/eclipse-workspace/T 
file system utt = 
Project type: Toolchains: 
> C» GNU Autotools Cross GCC 


~ BExecutable Linux GCC 


* Empty Project 

Hello World C++ Project 
上 C» Shared Library 
> G»Static Library 


> C» Makefile project 


Y! Show project types and toolchains only if they are supported on the platform 


e 


Next» Cancel Finish 
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在 该 对 话 框 中 输入 Project name (项 目 名 ) 为 Test。 选择 Project type (工程 类 型 ) 为 Hello World 
C++ Project。 另 外 ， 在 右边 选择 Toolchains (工具 链 ) X Linux GCC。 最 后 直接 单 击 Finish 按钮 。 
出 现 Test.cpp 的 代码 编辑 窗口 ， 这 时 Eclipse 自动 创建 一 个 简单 的 main 函数 。 我 们 来 编译 运行 它 ， 
首先 在 工具 栏 上 找到 Build All 按钮 或 直接 按 Ctrl+B 快捷 键 ， 如 图 2-34 所 示 。 





图 2-34 


build 相当 于 编译 的 过 程 ， 完 成 后 会 在 下 方 输出 窗口 显示 : 


make all 

Building file: ../src/Test.cpp 

Invoking: GCC C++ Compiler 

g++ -00 -g3 -Wall -c -fmessage-length=0 -MMD -MP -MF"src/Test.d" -MT"src/Test.o" 
-o "src/Test.o" "../src/Test.cpp" 

Finished building: ../src/Test.cpp 


Building target: Test 
Invoking: GCC C++ Linker 

g++ -o "Test" ./src/Test.o 
Finished building target: Test 


21:29:05 Build Finished (took 4s.632ms) 


没有 显示 错误 ， 说 明 我 们 编译 成 功 了 。 此 时 可 以 准备 运行 程序 。 注 意 ， 先 要 在 左边 的 Project 
Explorer 下 选中 工程 Test， 然 后 单 击 工具 栏 上 的 “运行 ”按钮 ， 如 图 2-35 所 示 。 


o 


图 2-35 


稍 等 会 ，Eclipse HAH FHARR “Hello World!!!”， 这 就 是 程序 打印 的 结果 ， 如 图 2-36 


1 roblems & asks onsole roperties si Cal raph a 
If Probl Tasks | B) Console 31 |E] Prop itif Call Grap X 


«terminated» (exit value: O) Test [C/C++ Application] /root/eclipse-workspace/Test/Debug/Test 
! t! Hello world!!! 








图 2-36 

COD 进行 单 步调 试 。 

在 工具 栏 上 单 击 debug (调试 ) 图 标 ， 如 图 2-37 所 示 。 
ie 


图 2-37 


然后 Eclipse 主 界面 就 会 进入 调试 模式 ， 并 且 会 停 在 程序 的 第 一 行 代码 上 《这 个 例子 的 第 一 行 
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代码 是 cout 语句 ， 第 二 行 代码 就 是 return 语句 ) 。 此 时 我 们 可 以 进行 单 步调 试 ， 按 F5 键 就 会 往 下 
走 一 步 ， 并 高 亮 在 第 二 行 代 码 上 ， 如 图 2-38 所 示 。 
eclipse-workspace - Test/src/Test.cpp - Eclipse 2L 


File Edit Source Refactor Navigate Search Project Run Window Help 








r3 园 局 e-:9:* » use BEmEi«Seie-0-:04- 
Beh 0-2 GuckAccess || &$ | <amEE> [46] 
Ar Debug 13 $% i > = o o variables f$ *o Breakpoints (i/i Registers Bà Modules E 
 [£]Test [C/C++ Application] gaina v 
* Test [9289] [cores: 0] Name Type Value 
* if Thread #1 [Test] 9289 [core: 0] (Suspended : Step) 
main() at Testcpp:14 Ox400890 
Bob 6n 
E Test.cpp 器 | 7 D E Outline Zt EN 
9 winclude <iootream [= 和 ş 
10 using namespace std; - 
u 
z-int main() { " iostream 
3 — cout << "I! Hello world!!!" << endl; // prints !!!Fello world!!! E 
4 return O; E aa 
3 
15 
© Console 器 Ë Tasks 加 Problems Ọ Executables @ Debugger Console ] Memory ang 


e xk &EB [BEES eorn- 
Test [C/C++ Application] Test 
IH Hello world!!! ] 








Writable Smart Insert 14:1 


图 2-38 


由 于 第 一 行 代码 执行 了 cout 语句 , 因此 在 Console (控制 台 ) GE F1 F Ath Hh ^ T Hello World!!!" o 
调试 结束 后 ， 我 们 可 以 单 击 右 上 角 的 “C/C++” 图 标 来 回 到 代码 编辑 窗口 ， 该 图 标 如 图 2-39 所 示 。 


Ta 


图 2-39 


至 此 ， 第 一 个 Eclipse C++ 程序 就 开发 完成 了 。Eclipse 功能 十 分 强大 ， 比 如 可 以 单 步调 试 、 是 
一 个 跨 平 台 开 发 工具 、 有 可 以 在 Windows 下 使 用 的 版 本 。 

除了 Eclipse 这 个 集成 开发 工具 外 ,在 Linux 下 开发 C++ 还 有 一 个 集成 开发 环境 QtCreator。 它 
通常 用 来 开发 Qt 程序 , 本 书 不 准备 介绍 Qt 的 开发 , 因此 这 里 只 是 简单 介绍 一 下 QtCreator 的 安装 。 
Qt 是 一 个 1991 年 由 奇 趣 科技 开发 的 跨 平台 C++ 图 形 用 户 界面 应 用 程序 开发 框架 , 既 可 以 开发 基于 
Qt 库 的 图 形 界面 程序 , 也 可 用 于 开发 和 Qt 无 关 的 标准 C/C++ 程序 。QtCreator 也 是 一 个 跨 平 台 开发 
工具 ， 有 可 以 在 Windows 下 使 用 的 版 本 。 

QtCreator 只 是 一 个 免费 的 开发 工具 ， 要 开发 Qt 程序， 还 需要 相应 的 Qt SDK， 就 像 VC 需要 
相应 的 SDK 一 样 。 可 以 从 网 站 https://www.qt.io/download-open-source/ 上 下 载 。 不 同 操作 系统 有 不 
同 的 版 本 ， 这 里 下 载 的 是 针对 64 位 的 Linux 版 本 : qt-opensource-linux-x64-5.7.0.run。 这 是 一 个 run 
格式 的 安装 文件 ， 包 含 Qt SDK 和 Qt Creators run 格式 文件 在 运行 前 通常 先 要 设置 可 执行 权限 ， 
然后 才能 运行 。 先 把 qt-opensource-linux-x64-5.7.0.run 拖 进 虚 拟 机 Linux. 我 们 在 终端 窗口 下 进入 文 
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件 qt-opensource-linux-x64-5.7.0.run 所 在 目录 ， 然 后 在 命令 行 下 输入 : 


# chmod +x qt-opensource-linux-x64-5.7.0.run 
# ./qt-opensource-linux-x64-5.7.0.run 


然后 就 会 出 现 安装 向 导 对 话 框 ， 如 图 2-40 所 示 。 


T CEER 





Welcome to the Qt 5.7.0 installer 


This installer provides you with the open source 
version of Qt 5.7.0. 
You have the option to log in using your Qt 
Account credentials (e.g. Qt Forum login). 


If you do not have a Qt Account yet, you can 
optto create one in the next step. 

Qt Account gives you access to everything Qt 
Packaging and pricing options 

LGPL compliance & obligations 

Choosing the right license for your project 





T—5W)»]| 取消 
图 2-40 


然后 单 击 “ 下 一 步 ”按钮 即 可 ， 安 装 很 简单 ， 如 果 需 要 把 Qt 源 代码 也 安装 上 ， 可 以 在 “选择 
组 件 ” 对 话 框 中 根据 需要 进行 选择 ， 如 图 2-41 所 示 。 


Qt 5.7.0 设置 





na 
dotis CIEN RIBEE * 


* 
E 
<2 

o 


IDE for Qt application 

t57 development 

Desktop gcc 64-bit 此 组 件 符 占用 您 大 约 235.42 MB 

Sources ERAT. 

Qt Charts. 

Qt Data Visualization 

Qt Purchasing 

Qt Quick 2D Renderer 

Qt Virtual Keyboard 

Qt WebEngine. 

Qt Gamepad (TP) 

Qt SCXML (TP) 

Qt SerialBus (TP) 

Qt Script (Deprecated) 
vw v Tools 


Qt Creator 4.0.2 


CECS 


BiA 





< 上 一 步 (B) | | 下 一 步 (N) > 取消 





图 2-41 


接着 单 击 “ 下 一 步 ” 按 钮 ， 一 直到 完成 。 安 装 完 毕 后 ， 可 以 在 安装 目录 Tools/QtCreator/bin 下 
发 现 有 Qt Creator 可 执行 文件 ， 双 击 它 即 可 运行 Qt Creator。 
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2.5 搭建 Windows 下 的 Linux C++ 开发 环境 


2.5.1 搭建 非 集成 式 的 Windows 下 的 Linux C++ 开发 环境 


前 面 介绍 了 在 Linux 下 开发 非 图 形 界面 程序 的 方式 ， 由 于 很 多 程序 员 习 惯 使 用 Windows, Al 
此 我 们 可 以 采取 在 Windows. 下 开发 Linux 程序 的 方式 。 基 本 步骤 就 是 先 在 Windows 下 用 自己 熟悉 
的 编辑 器 写 源 代码 ， 然 后 通过 网 络 连接 到 Linux， 把 源 代码 文件 (cpp 文件 ) 上 传 到 远程 Linux € 
机 , TE Linux 主机 上 对 源 代 码 进行 编译 、 调 试 和 和 运行， 当然 编译 和 调试 所 输入 的 命令 也 可 以 在 终端 
TA CHiN SecureCRT) 里 完成 ， 这 样 从 编辑 到 编译 、 调 试 、 运 行 都 可 以 在 Windows 下 操作 ， 注 
意 是 操作 (命令) ， 真 正 的 编译 、 调 试 、 运 行 工作 实际 都 是 在 Linux 主机 上 完成 的 。 

我 们 在 Windows 下 选择 什么 编辑 器 呢 ? Windows 下 的 编辑 器 多 如 牛 毛 ， 大 家 可 以 根据 自己 的 
习惯 选择 使 用 。 本 书 使 用 的 编辑 器 是 UltraEdit 〈 简 称 UE) ， 它 小 巧 且 功能 多 ， 还 具有 语法 高 亮 、 
函数 列表 显示 等 常见 编写 代码 所 需 的 功能 ， 对 付 普 通 的 小 程序 开发 绰绰有余 。 如 果 需 要 UE 显示 源 
文件 的 函数 列表 ， 可 以 按 F8 键 。 在 函数 列表 上 双击 某 个 函数 ， 就 可 以 跳 转 到 该 函数 的 定义 。 若 需 
要 对 C/C++ 语言 进行 语法 高 亮 , 则 可 以 选择 菜单 “视图 ”一 “查看 方式 (加 亮 文 件 类 型 )” 一 “C/C++”。 

用 UE 编辑 完 源 代码 后 ,就 可 以 通过 网 络 上 传 到 Linux 主机 或 Linux 虚拟 机 , 把 文件 从 Windows 
传 到 Linux 的 方式 也 很 多 ， 既 有 命令 行 的 sz/rz， 也 有 FTP 客户 端 、SecureFX 等 图 形 化 工具 ， 大 家 
可 以 根据 习惯 和 实际 情况 选择 合适 的 工具 。 本 书 使 用 的 是 命令 行 工 具 SCP。 关 于 SCP 的 详细 用 法 
后 面 会 再 讲 到 。 

把 源 代码 文件 上 传 到 Linux 后 ， 就 可 以 进行 编译 了 ， 编译 的 工具 可 以 使 用 gee 或 g++， 两 者 都 
可 以 编译 C++ 文件 ， 这 里 使 用 g++。 关 于 g++ 的 详细 用 法 后 面 会 再 讲 到 。 

编译 过 程 中 如 果 需 要 调试 ， 可 以 使 用 命令 行 的 调试 工具 GDB， 这 后 面 也 会 详细 阐述 。 下 面 介 

绍 在 Windows 下 开发 Linux 程序 的 过 程 。 


【 例 2.5】 第 一 个 在 Windows 下 开发 的 Linux C++ 程序 


1. 编辑 源 代码 
打开 UE (UE 是 Windows 下 的 一 个 编辑 器 ) ， 输 入 代码 如 下 : 








n 


#include <iostream> 
using namespace std; 


int main(int argc, char *argv[]) 
t 
char sz[] = "Hello, World!"; 
cout «« sz «« endl; 
return 0; 


) 
代码 很 简单 ， 无 须 多 言 ， 然 后 保存 为 test.cpp。 
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2. 上 传 源 文件 到 虚拟 机 Linux 

Linux 上 传 和 下 载 文件 常用 的 命令 是 sz/rz， 但 这 两 个 命令 需要 在 Linux 端 安装 ， 有 点 小 麻烦 。 
这 里 使 用 SecureCRT 自 带 的 可 视 化 文件 传输 工具 SecureFX， 它 可 以 用 于 在 Windows 与 Linux 之 间 
传输 文件 ， 利 用 SFTP 协议 或 SSH2 协议 实现 文件 安全 传输 (传输 过 程 的 数据 会 加 密 ) ， 也 可 以 利 
用 FTP 进行 标准 传输 (但 传输 过 程 并 不 加 密 ) 。 该 客户 端 具有 Explorer 风格 的 界面 ， 易 于 使 用 ， 
同时 提供 强大 的 自动 化 能 力 ， 可 以 实现 自动 化 的 安全 文件 传输 。 上 传 过 程 如 下 : 

首先 用 SecureCRT 连接 到 Linux, 然后 单 击 右上 角 工 具 栏 中 的 按钮 SecureFX,， 如 图 2-42 所 示 。 


mr] 
2-42 


此 时 会 启动 SecureFX 程序 ， 并 自动 打开 Windows 和 Linux 的 文件 浏览 窗口 ， 界 面 如 图 2-43 
所 示 。 


3 
3 





2-43 


图 2-43 左边 是 本 地 Windows 的 文件 浏览 窗口 ， 右 边 是 IP H 192.168.3.9 的 虚拟 机 Linux 的 文 
件 浏览 窗口 ， 如 果 需 要 把 Windows 中 的 某 个 文件 上 传 到 Linux， 只 需要 在 左边 选中 该 文件 ， 然 后 拖 
电 到 右边 的 Linux 窗口 中 ， 从 Linux. 下 载 文件 到 Windows 也 是 这 样 的 操作 ， 非 常 简单 。 大 家 实践 
一 下 即 可 上 手 。 

3. 编译 源 文件 

现在 源 文件 已 经 在 Linux 的 某 个 目录 下 了 , 我们 可 以 在 命令 行 下 对 其 进行 编译 。 在 Linux 下 编 
译 C++ 源 程序 通常 有 两 种 命令 ， 一 种 是 利用 命令 g++， 另 一 种 是 利用 命令 gcc， 它 们 都 是 根据 源 文 
件 的 后 级 名 来 判断 是 C 程序 还 是 C++ 程序 。 编译 也 是 在 SecureCRT 下 进行 , 我 们 打开 SecureCRT， 
连接 远程 Linux， 然 后 定位 到 源 文件 所 在 的 文件 来 ， 并 输入 g++ 编译 命令 : 
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[root@localhost test]# g++ test.cpp -o test 

[rootélocalhost test]# ls 

test test.cpp 

[rootélocalhost test]# ./test 

Hello, World! 

-o 表示 输出 ， 它 后 面 加 的 test 表示 最 终 输出 的 可 执行 程序 名 字 是 test. 

如 果 要 用 gec 来 编译 ， 可 以 这 样 输入 : 

[root@localhost zww]# gcc -o test -l stdc++ test.cpp 

[root@localhost zww]# ls 

test test.cpp 

[rootülocalhost zww]# ./test 

Hello, World! 

其 中 -o 表示 输出 ， 它 后 面 加 的 test 表示 最 终 输 出 的 可 执行 程序 名 字 是 test; -1 表示 要 连接 到 某 
个 库 ，stdc++ 表 示 C++ 标准 库 ， 因 此 -1 stdc++ 表 示 链 接 到 标准 C++ 库 。 


2.5.2 ”搭建 集成 式 的 Windows 下 的 Linux C++ 开发 环境 


相信 习惯 Windows 下 集成 开发 环境 的 程序 员 ， 对 非 集成 式 开发 环境 颇 为 头 大 ,VB、VC、.Net 
和 Delphi 等 优秀 基础 开发 环境 提高 了 我 们 的 效率 。 在 Windows 下 开发 Linux 程序 有 没有 集成 开发 
环境 呢 ? 答案 是 肯定 的 ， 微 软 为 了 壮大 Linux, Æ VC 2015 上 面 开始 支持 Linux 的 开发 。VC 2015 
全 称 是 Visual C++ 2015， 是 当前 Windows 平台 上 主流 的 集成 化 、 可 视 化 的 开发 软件 ， 功 能 异常 强 
大 ， 几 乎 是 一 个 “ 巨 无 霸 ”。 为 了 照顾 一 些 没 有 使 用 过 VC 系列 工具 的 朋友 ， 这 里 简单 介绍 一 下 它 
的 界面 ， 如 果 感 觉 不 好 ， 也 可 以 使 用 非 集成 方式 。 如 果 想 详细 掌握 VC 系列 工具 ， 可 以 参考 笔者 出 
版 的 另 一 本 书 《Visual C++ 2013 从 入 门 到 精通 》。 


1. 安装 

安装 VC 2015 就 不 介绍 了 ， 在 Windows 下 安装 软件 相信 大 家 都 是 高 手 ， 要 注意 系统 的 版 本 至 
少 是 Windows 7 spl 和 IE 10， 并 且 装 完 VC 2015 后 ， 要 打上 补丁 VS2015Update3， 这 个 补丁 可 以 
在 微软 官网 上 下 载 ， 笔 者 是 直接 在 Windows 10 下 安装 的 。 装 完 补丁 后 ， 还 需要 安装 VC 2015 开发 
Linux 的 插件 VC_Linux.exe， 下 载 链接 为 : 





https://visualstudiogallery.msdn.microsoft.com/725025cf-7067-45c2-8d01-1e0 
£d359ae6e/file/206420/7/VC Linux.exe?SRC-VSIDE 


安装 完毕 后 ， 还 要 在 CentOS 7 中 安装 gdb-gdbserver 软件 。 该 软件 可 以 从 网 上 下 载 ， 也 可 以 直 
接 从 下 载 资 源 中 获取 。 安 装 gdbserver 的 命令 为 : 


root@localhost soft]# rpm -i gdb-gdbserver-7.6.1-51.e17.x86 64.rpm --force 
--nodeps 


下 面 可 以 使 用 VC 2015 FÈ Linux 程序 了 。 
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2. 起 始 页 
第 一 次 打开 Visual C++ 2015 集成 开发 环境 时 ， 会 出 现 Visual C++ 2015 的 起 始 页 ， 如 图 2-44 
所 示 。 
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在 起 始 页 上 ， 我 们 可 以 进行 “新 建 项 目 ” “打开 项 目 ”等 操作 ， 并 且 最 近 打 开 过 的 项 目 也 能 
在 起 始 页 上 显示 。 如 果 开 发 者 的 计算 机 能 连接 Internet， 起 始 页 上 还 会 自动 显示 一 些微 软 官方 的 公 
告 、 产 品 信息 等 。 如 果 不 想 让 IDE 每 次 启动 都 显示 起 始 页 ， 可 以 取消 勾 选 起 始 页 左下 角 的 “启动 
时 显示 此 页 ” 复 选 框 ， 如 图 2-45 Bras. 
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图 2-45 


这 样 下 一 次 打开 IDE 的 时 候 ， 起 始 页 不 再 显示 。 不 显示 起 始 页 其 实 也 有 好 处 ， 就 是 不 用 每 次 
都 去 联网 显示 新 闻 或 公告 等 ， 能 加 快 IDE 的 打开 速度 。 

如 果 又 想 每 次 启动 IDE 时 都 显示 起 始 页 ， 可 以 单 击 主 菜单 中 的 “视图 ”一 “起 始 页 ”来 打开 
起 始 页 ， 如 图 2-46 所 示 。 
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图 2-46 


然后 重新 勾 选 起 始 页 左下 角 的 “启动 时 显示 此 页 ” 复 选 框 ， 这 样 下 次 启动 IDE 的 时 候 就 能 显 


示 起 始 页 了 。 
3. 主 界面 


在 Visual C++ 2015 主 界面 上 ， 集 成 开发 环境 的 操作 界面 包括 7 部 分 : 标题 栏 、 菜 单 栏 、 工 具 
栏 、 工 作 区 窗口 、 代 码 编辑 窗口 、 信 息 输 出 窗口 和 状态 栏 ， 如 图 2-47 所 示 。 
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4. 标题 栏 

在 标题 栏 上 可 以 看 到 当前 工程 的 名 称 和 当前 登录 操作 系统 的 用 户 类 型 ， 比 如 管理 员 类 型 ， 开 
发 的 程序 可 以 对 内 核 进行 操作 。 另 外 ,在 标题 栏 的 右边 有 一 个 反馈 按钮 ， 单 击 该 按钮 会 出 现 一 个 下 
拉 菜 单 ， 如 图 2-48 所 示 。 





发 送 笑脸 
AERE 
MSDN 论坛 gg) 
报告 Bug GD) 








[0»€ 





图 2-48 


其 中 有 一 个 “MSDN 论坛 ”菜单 项 ， 通 过 该 项 可 以 直接 访问 MSDN 论坛 。MSDN 论坛 有 很 多 
技术 论题 ， 我 们 遇 到 问题 也 可 以 去 讨论 。 


5. 菜单 栏 


Visual C++ 2015 的 菜单 栏 位 于 主 窗口 的 上 方 ， 包 括 “ 文 件 ”“ 编 辑 ”“ 视 图 ”“ 项 目 ”“ 生 
R” “调试 ” “团队 ”“ 工 具 ”“ 测 试 ” “体系 结构 ”“ 分 析 ”“ 窗 口 ” 和 “帮助 ”13 个 主 菜单 。 
IDE 操作 的 所 有 功能 都 可 以 在 菜单 里 找到 ， 比 如 在 “文件 ”菜单 里 面 可 以 进行 文件 、 项 目 和 解决 方 
案 的 打开 和 关闭 ， 以 及 IDE 的 退出 等 ， 如 图 2-49 所 示 。 
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图 2-49 


很 多 菜单 功能 都 会 用 到 ， 所 以 我 们 一 开始 也 没 必 要 每 项 菜单 都 去 熟悉 ， 用 到 的 时 候 自然 会 熟 
悉 ， 而 且 有 些 菜 单 功能 不 如 快捷 键 用 起 来 方便 ， 比 如 启动 调试 (F5) 、 单 步调 试 (F10/F11) 、 开 
始 运行 Ctrl+F5) 等 。 
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6. 工具 栏 


工具 栏 提供 了 和 菜单 几乎 一 一 对 应 的 命令 功能 ， 而 且 更 加 方便 。Visual C++ 2015 除了 提供 标 
准 的 工具 栏 之 外 ,还 能 自 定 义工 具 栏 ， 把 一 些 常用 的 功能 放 在 工具 栏 上 ， 比 如 在 工具 栏 上 增加 “ 生 
成 解决 方案 ”和 “开始 执行 〈 不 调试 ) ”按钮 。 默认 情 况 下 ,工具 栏 上 是 没有 “生成 解决 方案 ”和 
“开始 执行 (不 调试 ) ”按钮 的 ， 在 执行 程序 的 时 候 ， 每 次 都 要 进入 菜单 ， 单 击 “ 调 试 ” 一 “开始 
执行 (不 调试 ) ”来 启动 程序 ， 非 常 麻烦 ， 虽 然 有 Ctrl+F5 快捷 键 ， 但 也 要 让 手 离开 鼠标 ， 对 于 懒 
人 来 讲 也 是 有 点 痛苦 的 。 因此 , 最 好 在 工具 栏 上 有 这 么 一 个 按钮 , 只 要 鼠标 点 一 下 , 就 启动 执行 了 。 
“生成 解决 方案 ”相当 于 把 修改 过 的 工程 源 代码 都 编译 一 遍 , 在 不 需要 执行 的 时 候 , 也 会 经 常用 到 。 
让 “生成 解决 方案 ”和 “开始 执行 (不 调试 ) ”按钮 显示 在 工具 栏 上 的 步骤 如 下 : 


CD 添加 一 个 自 定义 的 工具 栏 。 打 开 Visual C++ 2015 的 集成 开发 环境 , 然后 在 工具 栏 的 右边 
空白 处 右 击 ， 会 出 现 一 个 快捷 菜单 ， 选择 最 末 一 项 “ 自 定义 ”, 在 “ 自 定义 ”对 话 框 中 单 击 “ 新 建 ” 
按钮 ， 新 建 一 个 工具 栏 ， 如 图 2-50 所 示 。 


自 定义 工具 栏 的 名 称 保持 默认 即 可 ， 如 图 2-51 所 示 。 
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然后 单 击 “ 确 定 ”按钮 ， 在 集成 开发 环境 的 工具 栏 上 即 可 多 出 一 个 工具 栏 ， 但 不 仔细 看 是 看 
不 出 来 的 ， 因 为 我 们 还 没 给 它 添加 命令 按钮 。 


(2) 在 “ 自 定义 ”对 话 框 中 切换 至 “命令 ”选项 卡 ， 选 择 “ 工 具 栏 ”， 然 后 在 右边 的 下 拉 菜 
单 中 选择 “ 自 定义 1”， 如 图 2-52 所 示 。 
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然后 单 击 “ 添 加 命令 ”按钮 ， 出 现 “ 添 加 命令 ”对 话 框 ， 在 “添加 命令 ”对 话 框 中 ， 在 左边 
的 “类 别 ” 下 选择 “生成 ”， 在 右边 的 “命令 ”下 选择 “生成 解决 方案 ”， 如 图 2-53 所 示 。 
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然后 单 击 “ 确 定 ”按钮 。 此 时 ， 我 们 新 建 的 工具 栏 上 就 有 了 一 个 “生成 解决 方案 ”按钮 。 


COD 再 添加 “开始 执行 〈 不 调试 ) ”按钮 。 同 样 ， 在 “ 自 定 义 ” 对 话 框 中 单 击 “ 添 加 命令 ”， 
然后 在 “添加 命令 ”对 话 框 中 ， 在 左边 的 “类 别 ” 下 选择 “调试 ”， 在 右边 的 “命令 ”下 选择 “ 开 
始 执行 〈 不 调试 ) ”， 如 图 2-54 所 示 。 
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最 后 单 击 “确定 ”按钮 ， 关 闭 “ 添 加 命令 ”对 话 框 ， 再 关闭 “ 自 定义 ”对 话 框 ， 此 时 我 们 新 
建 的 工具 栏 上 又 多 了 一 个 按钮 ， 共 有 2 个 按钮 了 ， 如 图 2-55 所 示 。 
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图 2-55 














7. 类 视图 

类 视图 用 于 显示 正在 开发 的 应 用 程序 中 的 类 名 及 其 类 成 员 函 数 和 成 员 变量 。 可 以 在 “视图 ” 
菜单 中 打开 “类 视图 ”窗口 。 类 视图 分 为 上 部 的 “对 象 ” 窗 格 和 下 部 的 “成 员 ” 窗 格 。“ 对 象 ” 窗 
格 包含 一 个 可 以 展开 的 符号 树 ， 其 顶级 节点 表示 每 个 类 ， 如 图 2-56 所 示 。 


类 视图 5x 
*» 10oo|eo-|^ 
< 搜索 > J2 £ 
4 Test a 

b om RE 

In 宏和 常量 

Qo 全 局 函数 和 变量 

b $s CAboutDlg 

b fg CMainFrame 


ree 


b fg CTestDoc X 














f CTestAppO 

® Exitinstance0 
Ó Initinstance0 
$ OnAppAbout) 








8. 解决 方案 资源 管理 器 
这 个 视图 显示 的 是 当前 解决 方案 中 的 各 个 工程 以 及 每 个 工程 中 的 源 文件 、 头 文件 、 资 源 文件 
的 文件 名 ， 并 且 分 类 显示 ， 如 果 要 打开 某 个 文件 ， 直 接 双击 文件 名 即 可 。 我 们 还 能 在 解决 方案 资源 


管理 器 中 删除 文件 或 添加 文件 。 图 2-57 所 示 就 是 一 个 解决 方案 资源 管理 器 。 
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9. 输出 窗口 


输出 窗口 用 于 显示 程序 的 编译 结果 和 程序 执行 过 程 中 的 调试 输出 信息 ， 比 如 我 们 调用 函数 


OutputDebugString 就 可 以 在 输出 窗口 中 显示 一 段 字 符 串 。 通 过 “视图 ”菜单 的 “输出 ”菜单 项 打 
开 输 出 窗口 ， 如 图 2-58 所 示 。 


输出 


-Ox 


D--—--- 已 启动 生成 : ME: Test, MÆ: Debug Win32 ———- a 
1» TestView. cpp 


1» Test. vexproj -> G: wybookVWeVvcRil veRilpr jAl1 \code\ch09\ 
成 功 1 个 , AW 0 个 ,最 新 0 个 ， 跳 过 0 “了 
上 








图 2-58 


10. 错误 列表 


错误 列表 用 来 显示 编译 或 链接 的 出 错 信息 。 双 击 错误 列表 中 的 某 行 ， 可 以 定位 到 源 代码 出 错 
的 地 方 。 通 过 “视图 ”菜单 的 “错误 列表 ”菜单 项 打开 错误 列表 ， 如 图 2-59 所 示 。 






1 error C2039: "InsertColumn1” :不 
是 "CUstCtl" 的 成 员 


552 IntelliSense: dass "CListCtr" 没有 成 员 TestViewcpp — 82 
"InsertColumni* 





11. 设置 源 代码 编辑 窗口 的 颜色 


默认 情况 下 ， 源 代码 编辑 窗口 的 背景 色 是 白色 的 ， 代 码 文本 颜色 是 黑色 的 ， 这 样 的 颜色 对 比 
比较 强烈 , 看 久 了 了 眼睛 容易 疲劳 ,为 此 我 们 可 以 设置 自己 喜欢 的 背景 色 。 方法 是 在 主 界面 的 菜单 中 
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选择 “工具 ”一 “选项 ”， 打 开 “ 选 项 ”对 话 框 ， 然 后 在 左边 展开 “环境 ”， 在 展开 的 项 目的 末尾 
找到 并 选中 “字体 和 颜色 ”， 接 着 在 右边 的 显示 项 中 选择 “ 纯 文 本 ”， 就 可 以 通过 设置 “项 前 景 ” 





1 E= 


"EROS 
Eee 


Dmte) 


me 





3 = In 90 (0xE811); 


Cmm] (om J 























图 2-60 


12. 显示 行 号 
默认 情况 下 ， 源 代码 编辑 窗口 的 左边 是 不 显示 行 号 的 ， 如 果 要 显示 行 号 ， 可 以 在 主 界面 的 菜 
单 中 选择 “工具 ”一 “选项 ”， 打 开 “ 选 项 ”对 话 框 ， 然 后 在 左边 展开 “文本 编辑 器 ”， 在 展开 的 
项 目 中 找到 并 选中 “C/C++”， 接 着 在 右边 就 可 以 看 到 “ 行 号 ”， 如 图 2-61 所 示 。 
- - 





P gem 
F IARAM) 





13. 使 用 VC 2015 FÈ Linux 程序 
这 里 要 强调 一 下 ，VC 2015 要 安装 补丁 Update 3 和 插件 VC_Linux.exe， 然 后 在 Linux 下 安装 
gdb-gdbserver 后 才能 开发 Linux 程序 。gdb-gdbserver 可 以 从 网 上 搜索 下 载 , 也 可 以 从 下 载 资源 中 获 
取 ， 安 装 gdb-gdbserver 的 命令 如 下 : 
[root@localhost soft]# rpm -ivh gdb-gdbserver-7.6.1-51.e17.x86 64.rpm 


--force --nodeps 
fi: gdb-gdbserver-7.6.1-51.e17.x86 64.rpm: 头 V3 RSA/SHA256 Signature, 918] ID 
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f4a80eb5: NOKEY 


HET... PH E EAA [1003] 
正在 升级 /安装 . . . 
1:gdb-gdbserver-7.6.1-51.e17 AHHHHHHHHHHHHHHHHHHHHHHHHHHHHE EE H 
[100%] 


安装 后 ， 可 以 查询 一 下 是 否 安装 成 功 : 


[root@localhost soft]# rpm -q gdb-gdbserver 
gdb-gdbserver-7.6.1-51.e17.x86 64 


查询 到 已 安装 成 功 ， 现 在 万 事 俱 备 ， 可 以 开始 编写 程序 了 。 
【 例 2.6】 第 一 个 VC 2015 开发 的 Linux C++ 程 序 
(1) 打 开 VC 2015, 在 主 菜单 上 选择 “文件 ”一 “新 建 ” 一 “项 目 ” 或 者 直接 按 快捷 键 Ctrl+Shift+N， 
此 时 会 出 现 “ 新 建 项 目 ” 对 话 框 ， 在 “新 建 项 目 ” 对 话 框 的 左边 展开 “模板 ”一 “Visual C++” 一 


“Cross Platform”， 在 “Cross Platform” 下 选中 “Linux”， 输 入 项 目 名 称 和 路 径 后 ， 单 击 “ 确 定 ” 
按钮 。 


Q) 此 时 会 出 现 一 个 对 话 框 ， 让 我 们 输入 目标 机 器 (CentOS 7) 的 主机 名 、 端 口 、 账 户 、 口 
令 等 信息 ， 如 图 2-62 所 示 。 


Connect to Linux 


This project uses remote builds, and a remote machine is required 
to host the builds and debug. Please erter the remote machire 





Authentication type: [Password 


Password: jeevoee 


[Senned ]| Cancel 
图 2-62 
然后 单 击 “Connect” 按 钮 。 注 意 : 这 里 要 确定 我 们 的 目标 主机 能 ping 通 ， 并 且 用 终端 软件 
(SecureCRT) 能 登录 上 去 。 


接着 会 出 现 源 代 码 编辑 窗口 ， 并 且 main.cpp 已 经 默认 为 我 们 建 好 了 ， 可 以 在 main.cpp 中 输入 
代码 : 


#include <iostream> 
using namespace std; 


int main(int argc, char *argv[]) 


{ 
char sz[] = "Hello, World!"; 
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cout «« sz «« endl; 
return 0; 


) 


此 时 单 击 工具 栏 上 的 “运行 ”按钮 ， 就 可 以 运行 程序 了 。 在 目标 主机 的 /rooyprojects/ 下 有 一 个 
test 文件 夹 ， 里 面 有 源 代码 main.cpp， 说 明 VC 2015 自动 帮 我 们 上 传 了 源 代码 文件 main.cpp。 在 
Linux 下 进入 /root/projects/test， 会 发 现 有 bin 文件 夹 ， 它 的 子 文件 夹 x64/Debug 存放 着 最 终生 成 的 
程序 ， 进 入 /root/projects/test/bin/x64/Debug， 会 发 现 最 终 的 可 执行 文件 test.out， 运 行 它 : 





[root@localhost Debug]# ./test.out 
Hello, World! 


熟悉 的 Hello, World 出 现 了 ， 说 明 我 们 成 功 了 。 
G) 如 果 需 要 调试 ,可 以 按 FS 键 启动 调试 模式 , 然后 可 以 按 F10 键 进行 单 步调 试 , 如 图 2-63 


Wi Mab o amo mo sy sm wes 


o rr 





图 2-63 


VC 2015 异常 强大 ， 更 多 功能 限于 篇 幅 无 法 多 讲 , 大 家 如 果 需 要 设置 更 多 功能 ， 可 以 在 工程 的 
属性 中 去 探 宝 。 在 VC 2015 的 “解决 方案 资源 管理 器 ”视图 上 ， 可 以 对 工程 右 击 ， 然 后 在 快捷 菜 
单 中 选择 “属性 ”， 打 开工 程 “ 属 性 ”对 话 框 。 或 者 选择 VC 2015 的 主 菜单 “项 目 ” 一 “属性 ”， 
也 可 以 打开 “属性 ”对 话 框 。 

是 不 是 感觉 很 强大 ? 但 是 我 们 还 是 要 学 会 命令 的 开发 方式 ， 尤 其 后 面 讲述 的 几 个 工具 ， 非 常 
有 用 。 











26 ”需要 掌握 的 开发 工具 
有 一 定 经 验 的 程序 员 还 是 喜欢 非 集成 的 开发 方式 ， 因 此 掌握 命令 行 工具 是 基本 功 。 何 况 很 多 
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企业 开发 的 场景 是 不 会 提供 Linux 图 形 界面 让 你 开发 非 图 形 界 面 的 Linux 程序 的 , 即 不 会 提供 集成 
开发 环境 来 开发 非 图 形 界面 的 Linux 程序 。 尤 其 是 现场 客户 支持 和 排 错 的 时 候 ， 能 使 用 的 开发 工具 
更 少 , 屠 种 环境 更 加 不 会 提供 Windows 系统 让 你 舒 每 服 服 地 编辑 。 因此，Linux 开发 者 必须 要 掌握 
几 个 Linux 字符 界面 下 的 开发 工具 ， 比 如 编辑 器 vi/vim、 编 译 器 gcc、 调 试 gdb， 还 有 Makefile X 
件 的 编写 , 这 几 种 工具 一 般 在 客户 现场 的 环境 中 都 会 提供 , 掌握 它们 是 基本 功 。 我 们 在 家 里 (单位 》 
开发 或 许 有 更 好 的 环境 工具 使 用 , 但 一 定 要 考虑 以 后 到 用 户 现场 开发 和 排 错时 的 场景 ， 那 时 只 有 这 
几 样 武器 。 废 话 不 多 说 ， 下 面 介绍 这 几 样 武器 。 





2.7 vi 编辑 器 的 使 用 


2.7.1 vi 编辑 器 概述 


Linux 下 的 文本 编辑 器 有 很 多 ， 图 形 模式 下 有 gedit、kwrite 等 编辑 器 ， 文 本 模式 下 有 vi vim 
Cvi 的 增强 版 本 ) 和 nano。vi 和 vim 是 Linux 系统 中 常用 的 编辑 器 ，vim 相当 于 vi 的 加 强 版 本 。 

vi 编辑 器 是 Linux 和 UNIX 上 基本 的 文本 编辑 器 ， 工 作 在 字符 模式 下 。 由 于 不 需要 图 形 界 面 ， 
因此 vi 是 效率 很 高 的 文本 编辑 器 。 尽 管 在 Linux 上 也 有 很 多 图 形 界 面 的 编辑 器 可 用 ， 但 vi 在 没有 
图 形 界面 的 系统 中 《〈 比 如 嵌入 式 系统 、 服 务 器 系统 ) 的 功能 是 那些 图 形 编辑 器 所 无 法 比拟 的 。 一 句 
话 ， 当 没有 图 形 界面 时 ，vi 就 是 编辑 器 “一 哥 ”。 而 且 Linux 重要 的 应 用 场合 就 是 嵌入 式 系统 或 服 
务 器 系统 。 

vi 编辑 器 是 所 有 Linux 系统 的 标准 编辑 器 ， 用 于 编辑 任何 ASCII 文本 ， 对 于 编辑 源 程序 尤其 
有 用 。 它 的 功能 非常 强大 ， 通 过 使 用 vi 编辑 器 可 以 对 文本 进行 创建 、 查 找 、 蔡 换 、 删 除 、 复 制 和 
粘贴 等 操作 。 


2.7.2 vi 编辑 器 的 工作 模式 


vi 编辑 器 有 3 种 基本 工作 模式 ， 分 别 是 命令 〈 行 ) 模式 、 揪 入 模式 和 末 行 模式 。 在 使 用 时 ， 
一 般 将 末 行 模式 也 算 入 命令 行 模式 。 各 模式 的 功能 区 分 如 下 。 


COD 命令 行 模式 

控制 屏幕 光标 的 移动 ， 字 符 、 字 或 行 的 删除 ， 移 动 、 复 制 某 区 域 及 进入 插入 模式 ， 或 者 到 末 
行 模式 。 

(2) 插入 模式 

只 有 在 插入 模式 下 才 可 以 做 文本 输入 ， 按 ESC 键 可 回 到 命令 行 模式 。 


(3) 末 行 模式 
将 文件 保存 或 退出 vi 编辑 器 ， 也 可 以 设置 编辑 环境 ， 如 寻找 字符 串 、 列 出 行 号 等 。 在 命令 行 
模式 下 按 “: ” 即 可 进入 末 行 模式 。 
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2.7.3 vi 的 基本 操作 


(1) 进入 vi 编辑 器 

在 系统 shell 提示 符 下 输入 vi 及 文件 名 称 后 ， 即 可 进入 vi 编辑 界面 。 如 果 系 统 内 还 不 存在 该 
文件 ， 就 意味 着 要 创建 文件 ， 如 果 系统 内 存在 该 文件 ， 就 意味 着 要 编辑 该 文件 。 下 面 介绍 用 vi 编 
辑 器 创建 文件 的 示例 。 


#vi filename 


进入 vi 之 后 ， 系 统 处 于 命令 行 模式 ， 要 切换 到 插入 模式 才能 够 输入 文字 。 


(2) 切换 至 插入 模式 编辑 文件 
在 命令 行 模式 下 按 字 母 键 i 就 可 以 进入 插入 模式 ， 这 时 就 可 以 开始 输入 文字 了 。 


G) 退出 vi 及 保存 文件 

在 命令 行 模式 下 ， 按 冒号 键 (: ) 可 以 进入 末 行 模式 ， 例 如 [:w filename] 将 文件 内 容 以 指定 的 
文件 名 filename 保存 。 

输入 “wq”， 存 盘 并 退出 vi。 输 入 “q!”， 不 存盘 强制 退出 vio 

图 2-64 展示 了 vi 编辑 器 3 种 模式 之 间 的 关系 。 





2.7.4 ”命令 行 模式 下 的 基本 操作 


1. 进入 插入 模式 


按 下 列 字 符 键 时 就 可 以 进入 插入 模式 。 虽然 都 是 进入 插入 模式 ， 但 稍微 有 些 区 别 ， 尤 其 是 光 
标 所 在 的 位 置 。 


a: 从 目前 光标 所 在 位 置 的 下 一 个 位 置 开始 输入 文字 。 
A: 在 光标 所 在 行 的 行 末 插入 。 

i: 从 光标 当前 位 置 开始 输入 文件 。 

I: 在 光标 所 在 行 的 行 首 插入 。 

o: 在 光标 所 在 行 的 下 面 插入 一 行 。 

O: 在 光标 所 在 行 的 上 面 插入 一 行 。 
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€ s 删除 光标 后 的 一 个 字符 ， 然 后 进入 插入 模式 。 
€ S: 删除 光标 所 在 的 行 ， 然 后 进入 插入 模式 。 

2. 从 插入 模式 切换 为 命令 行 模 于 

直接 按 ESC 键 即 可 从 插入 模式 切换 为 命令 行 模式 。 


3. 移动 光标 
vi 可 以 直接 用 键盘 上 的 光标 来 上 下 左右 移动 ， 但 正规 的 vi 是 用 小 写 英文 字母 “h”“j”“k” 
“1” 分 别 控制 光标 左 、 下 、 上 、 右 移 一 格 的 。 


Ctrl+B: 屏幕 往 后 移动 一 页 。 
Ctrl+F: 屏幕 往 前 移动 一 页 。 
Ctl-U: 屏幕 往 后 移动 半 页 。 
Ctrl+D: 屏幕 往 前 移动 半 页 。 
gg: 移动 到 文件 的 开头 。 
G: 移动 到 文件 的 末尾 。 
$: 移动 到 光标 所 在 行 的 行 尾 。 
^ 移动 到 光标 所 在 行 的 行 首 。 
w: 光标 跳 到 下 个 字 的 开头 。 
e: 光标 跳 到 下 个 字 的 字 尾 。 
b: 光标 回 到 上 个 字 的 开头 。 
. 删除 文字 
x: 每 按 一 次 ， 删 除 光标 所 在 位 置 的 后 面 一 个 字符 。 
nx: 例如 ，“6x” 表 示人 删除 光标 所 在 位 置 后 面 6 个 字符 。 
X: 大 写 的 X， 每 按 一 次 ， 删 除 光标 所 在 位 置 的 前 面 一 个 字符 。 
nX: 例如 ，“20X” 表 示 删 除 光 标 所 在 位 置 前 面 20 个 字符 。 
dd: 删除 光标 所 在 行 。 
ndd: 从 光标 所 在 行 开始 删除 n 行 。 例 如 ，“4dd” 表 示 删 除 从 光标 所 在 行 开 始 的 4 
行 字符 。 
复制 
yw: 将 光标 所 在 之 处 到 字 尾 的 字符 复制 到 缓冲 区 中 。 
nyw: 复制 n 个 字符 到 缓冲 区 。 
yy: 复制 当前 行 。 
nyy: 例如 ，“6yy” 表 示 复 制 从 光标 所 在 行 开始 的 6 行 字 符 。 
959] 
dd: 前 切 当 前 行 。 


© ee ~ 0909000000909 0909 


eo eooo o 
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. 粘贴 
p: 将 缓冲 区 内 的 字符 粘贴 到 光标 所 在 位 置 的 后 面 。 
. 撤销 上 一 次 操作 
u 如 果 误 执行 一 个 命令 ， 可 以 马上 按 u 键 ， 回 到 上 一 个 操作 。 按 多 次 u 键 可 以 执行 
多 次 撤销 操作 。 
9. 跳 至 指定 的 行 
€ Ctrl+G: 列 出 光标 所 在 行 的 行 号 。 
€ nG: 例如 ，“5G”， 表 示 移 动 光 标 到 该 文件 的 第 5 行 行 首 ， 行 跳 转 都 是 基于 文件 首 
行 的 。 
10. 存盘 退出 
© Zz 存盘 退出 。 
11. 不 存盘 退出 
€ ZQ: 不 存盘 退出 。 
12. 命令 模式 小 结 
命令 行 模式 下 的 基本 操作 如 表 2-1 所 示 。 
表 2-1 命令 行 模式 下 的 基本 操作 
命令 行 模式 : 移动 光标 的 方法 
h 或 向 左 方向 键 (一 ) 光标 向 左 移动 一 个 字符 
j 或 向 下 方向 键 (| ) 光标 向 下 移动 一 个 字符 
1 或 向 右 方向 键 (一 ) 光标 向 右 移动 一 个 字符 
如 果 想 要 进行 多 次 移动 ， 例 如 向 下 移动 30 行 ， 可 以 使 用 “30j” 或 “30 1 ”的 组 合 键 ， 即 加 上 想 要 进行 的 ; 
数 (数字 ) 后 ， 操 作 即 可 
“向 下 ”移动 一 页 ， 相 当 于 Page Down 按键 
“向 上 ”移动 一 页 ， 相 当 于 Page Up 按键 


@ oo © ~ 




















+ 光标 移动 到 非 空格 符 的 下 一 行 
|- | 光标 移动 到 非 空格 符 的 上 一 行 
n 表示 “数字 ”， 按 下 数字 后 再 按 空格 键 ， 光 标 会 向 右 移动 这 一 行 的 n 个 字符 。 
例如 20<space>， 光 标 会 向 后 面 移动 20 个 字符 


[o | 这 是 数字 “0”， 移 动 到 这 一 行 最 前 面 的 字符 处 常用 ) 


n<space> 
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( 续 表 ) 

Is [移动 到 这 一 行 最 后 面 的 字符 处 (常用) 

|H [光标 移动 到 这 个 屏幕 的 最 上 方 那 一 行 

[|M |[ 光标 移动 到 这 个 屏幕 的 中 央 那 一 行 

光标 移动 到 这 个 屏幕 的 最 下 方 那 一 行 

移动 到 这 个 文件 的 最 后 一 行 ( 常 用 ) 

n 为 数字 。 移动 到 这 个 文件 的 第 n 行 。 例如 20G 则 会 移动 到 这 个 文件 的 第 20 行 
(可 配合 : set nu) 

[gg 。 [移动 到 这 个 文件 的 第 一 行 ， 相 当 于 1G (常用 ) 

n 为 数字 。 光 标 向 下 移动 n 行 (常用) 
从 光标 位 置 开始 , 向 下 寻找 一 个 名 为 word 的 字符 串 。 例 如 要 在 文件 内 搜索 vbird 
这 个 字符 串 ， 就 输入 /vbird (常用 ) 

F 始 ， 向 上 寻找 一 个 名 为 word 的 字符 串 

n 是 英文 按键 , 表示 “重复 前 一 个 搜索 的 动作 ”。 举例 来 说 ,如 果 刚 刚 执行 /vbird 

去 向 下 搜索 vbird 字符 串 ， 则 按 下 n 键 后 ， 会 向 下 继续 搜索 下 一 个 名 称 为 vbird 

的 字符 串 





这 个 N 是 英文 按键 。 与 n 刚好 相反 ， 为 “ 反 向 ”进行 前 一 个 搜索 操作 。 例 如 
行 /vbird 后 ， 按 下 N 则 表示 “向 上 ”搜索 vbird 


命令 行 模式 : 搜索 与 替换 
nl 与 n2 为 数字 。 在 第 nl 与 n2 行 之 间 寻 找 wordl 这 个 字符 串 ， 并 将 该 字符 串 
:nl1、n2s/wordl/word2/g 替换 为 word2。 举 例 来 说 ， 在 100 到 200 行 之 间 搜索 vbird 并 替换 为 VBIRD， 
则 为 “:100、200s/vbird/VBIRD/g”〈( 常 用) 
:1、$s/wordl/word2/g 从 第 一 行 到 最 后 一 行 寻找 wordl 字符 串 ， 并 将 该 字符 串 蔡 换 为 word2〈 常 用 ) 


从 第 一 行 到 最 后 一 行 寻找 word1 FR, Ai 串 蔡 换 为 word2， 且 在 蔡 
:1、$s/wordl/word2/gc pa f xX aM . B 
换 前 显示 提示 符 给 用 户 确认 (conform) 是 否 需 要 替换 (常用 ) 


令 行 模式 : 删除 、 复 制 与 粘贴 


p 为 将 已 复制 的 数据 粘贴 到 光标 的 下 一 行 ,P 则 为 粘贴 在 光标 上 一 行 。 举 例 来 说 ， 
当前 光标 在 第 20 行 ， 且 已 经 复制 了 10 行 数据 ， 则 按 下 p 后 ,这 10 行 数据 会 炸 
:原来 的 20 行 之 后 ， 即 由 21 行 开始 粘贴 。 但 如 果 是 按 下 P， 那 么 原来 的 第 20 
行 会 被 变 成 30 行 ( 常 用 ) 
| 


J 将 光标 所 在 行 与 下 一 列 的 数据 结合 成 同一 行 


复 删除 多 个 数据 ， 例 如 向 下 删除 10 行 ，[10cj] 


u 原 前 一 个 操作 (常用 ) 
[Ctrl]+r 做 上 一 个 操作 (常用 ) 


u 与 [Ctrljtr 是 很 常用 的 命令 。 一 个 是 复原 ， 另 一 个 则 是 重 做 一 次 。 利 用 这 两 个 功能 按键 ， 编 辑 起 来 得 心 应 手 
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( 续 表 ) 


命令 行 模式 : 删除 、 复 制 与 粘贴 








«DEAEEEEEN 这 就 是 小 数 点 ， 意 思 是 重复 前 一 个 动作 。 如 果 想 重复 删除 、 重 复 粘贴 ， 按 下 小 
数 点 “.” 就 可 以 了 (常用) 


2.7.5 


插入 模式 


插入 模式 用 来 向 文本 中 添加 、 修 改 或 删除 文本 内 容 ， 也 就 是 通常 所 说 的 编辑 工作 。 如 果 要 退 
回 到 命令 行 模式 ， 可 以 按 ESC 键 。 





2.7.6 ”未 行 模式 操作 

在 使 用 末 行 模式 之 前 ， 记 住 先 按 ESC 键 确 定 已 经 处 于 命令 行 模式 后 ， 再 按 冒 号 “: ” 即 可 进 
入 末 行 模式 。 

1. 列 出 行 号 

€ setnu: 输入 “setnu” 后 ， 会 在 文件 中 的 每 一 行 前 面 列 出 行 号 。 

2. 取消 列 出 行 号 

€ setnonu: 输入 “setnonu” 后 ， 会 取消 在 文件 中 的 每 一 行 前 面 列 出 行 号 。 

3. 搜索 时 忽略 大 小 写 

€ setic: 输入 “setic” 后 ， 会 在 搜索 时 忽略 大 小 写 。 

4. 取消 搜索 时 忽略 大 小 写 

€ setnoic: 输入 “set noic” 后 ， 会 取消 在 搜索 时 忽略 大 小 写 。 

5. 跳 到 文件 中 的 某 一 行 

€ n “n” 表 示 一 个 数字 ， 在 冒号 后 输入 一 个 数字 ， 再 按 回 车 键 就 会 跳 到 该 行 ， 如 输入 


数字 15， 再 按 回 车 键 就 会 跳 到 文本 的 第 15 行 。 


6. 查找 字符 

€ /关键 字 : 先 按 “/” 键 , 再 输入 想 查找 的 字符 ， 如 果 第 一 次 查找 的 关键 字 不 是 想 要 的 ， 
可 以 一 直 按 nn 键 ， 往 后 查找 一 个 关键 字 。 

e ?关键 字 : 先 按 ? 键 ， 再 输入 想 查找 的 字符 ， 如 果 第 一 次 查找 的 关键 字 不 是 想 要 的 ， 可 
以 一 直 按 mn 键 ， 往 后 查找 一 个 关键 字 。 

7. 运行 shell 命令 

€  !cmd: 运行 shell 命令 cmd. 

8. 蔡 换 字符 

€ s/SEARCH/REPLACE/g: 把 当前 光标 所 处 的 行 中 的 SEARCH. 单词 替换 成 


*55* 





Linux C E C++ 一 线 开 发 实践 





REPLACE， 并 把 所 有 SEARCH 高 亮 显示 。 
€  "s/SEARCH/REPLACE: 把 文档 中 所 有 SEARCH 替换 成 REPLACE。 
€ nln2s/SEARCH/REPLACE/g: nl, n2 表示 数字 ， 表 示 从 nl 行 到 n2 行 ， 把 SEARCH 


替换 成 REPLACE。 
9. 保存 文件 
€ w: 在 冒号 前 输入 字母 “w” 就 可 以 将 文件 保存 起 来 。 
10. 离开 vi 


€ q 按 q 健 即 可 退出 vi 如 果 无 法 离开 vi, 可 以 在 “q” 后 面 输入 一 个 “!” 强 制 符 离开 vi. 
€ qw: 一 般 建 议 离开 时 ， 搭 配 “w” 一 起 使 用 ， 这 样 在 退出 的 时 候 还 可 以 保存 文件 。 
11. 命令 行 模式 小 结 
命令 行 模式 下 的 基本 操作 如 表 2-2 所 示 。 

表 2-2 命令 行 模式 下 的 基本 操作 


若 文件 属性 为 “只 读 ”， 则 强制 写 入 该 文件 。 不 过 ， 到 底 能 不 能 写 入 ， 与 文件 
权限 有 关 
若 曾 修改 过 文件 ， 又 不 想 存储 ， 则 使 用 ! 强制 离开 不 存储 文件 


存储 后 离开 ， 若 为 :wq!， 则 为 强制 存储 后 离开 《常用 ) 


将 文件 还 原 到 最 原始 的 状态 
若 文件 没有 更 改 ， 则 不 存储 离开 ， 若 文件 已 经 更 改 ， 则 存储 后 离开 


将 编辑 的 数据 存储 成 另 一 个 文件 (类似 另存 新 文件 ) 


[filename] 在 编辑 的 数据 中 ， 读 入 另 一 个 文件 的 数据 ， 即 将 “filenamey” 文件 内 容 加 到 光标 
enam 
Lai 所 在 行 的 后 面 


将 nl 到 n2 的 内 容 存储 成 filename 文件 
暂时 离开 vi， 到 命令 模式 下 执行 command 的 显示 结果 。 例如,，“:!1s /home”， 
即 可 在 vi 中 查看 /home 中 以 Is 输出 的 文件 信息 





显示 行 号 ， 设 置 之 后 ， 会 在 每 一 行 的 前 缀 显示 该 行 的 行 号 
Ey oa ma SE NS 


注意 ， 感 叹 号 (D Evi 中 常常 具有 "强制 "的 意思 。 





vi 命令 较 多 ， 但 常用 到 的 命令 也 可 能 只 有 一 半 。 通 常 vi 的 命令 除了 上 面 注 明 “常用 ”的 外 ， 
其 他 的 可 以 做 一 张 简单 的 命令 表 ， 当 有 问题 时 可 以 马上 查询 ， 如 图 2-65 所 示 。 
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q: 后 焉 字符 参数 i 
ws 移动 光标 所 t 行 至 屏幕 顶端 ， 
web 合 今 可 视 模式 : m iy), 
“(hb): &uuxilfocl] bari; baz) 3 漫游 后 对 选中 的 区 域 执行 操作 (vim only) (6) pa 
Aia. bar, bar) i s Ef DUE TER (vim only) 








图 2-65 


2.8 gcc 编译 器 的 使 用 


Linux 系统 下 的 gcc (GNU C Compiler) 是 GNU 推出 的 功能 强大 、 性 能 优越 的 多 平台 编译 器 ， 
是 GNU 的 代表 作品 之 一 。gcc 是 可 以 在 多 种 硬 体 平台 上 编译 出 可 执行 程序 的 超级 编译 器 ， 其 执行 
效率 与 一 般 的 编译 器 相 比 ， 平 均 效率 要 高 20%~30%。 因 为 它 功能 十 分 强大 ， 而 且 开 源 ， 所 以 很 多 
著名 的 软件 都 通过 它 来 编译 。 很 多 人 知道 它 可 以 编译 C 语言 源 程序 ， 其 实 还 可 以 用 来 编译 C++ 语 
言 源 程序 。 虽 然 另 一 个 C++ 编译 工具 g++ 更 专业 些 , 但 作为 一 个 C++ 开发 者 ， 学 会 gcc 工具 的 使 用 
也 是 必 备 技能 。C++ 程 序 员 应 该 同样 能 开发 C 语言 程序 ， 所 以 gc 也 要 学 会 使 用 ， 更 何况 gcc 也 能 
用 来 编译 C++。 


2.8.1 gcc 对 C 语言 的 编译 过 程 


前 面 的 例子 中 对 C++ 编译 用 了 一 条 gec 命令 ， 但 内 部 其 实 不 是 这 么 简单 的 。gcc 对 C/C++ 语言 
的 编译 过 程 可 分 为 4 个 阶段 : 预 处 理 (Preprocess) 、 编 译 (Compilation) 、 汇 编 CAssembly) 和 
链接 (Linking) ， 如 图 2-66 所 示 。 
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源 文件 [mea | 


P. c 5-8. - 汇编 程序 


可 执行 文件 [ika] 。 目标 文件 cas] 


[j29-(0eo* 
m Ext 


图 2-66 


1. 预 处 理 

预 处 理 就 是 对 源 程 序 中 的 伪 指令 〈 以 # 开 头 的 指令 )》 和 特殊 符号 进行 处 理 的 过 程 。 伪 指令 包括 
宏 定 义 指令 、 条 件 编译 指令 和 头 文件 包含 指令 。gce 对 C 源 文件 进行 预 处 理 后 会 输出 .i 文件 。 

预 编译 过 程 主要 处 理 那 些 源 代 码 中 以 # 开 始 的 预 编译 指令 ， 主 要 处 理 规则 如 下 : 


CD 将 所 有 的 #define 删除 ， 并 且 展 开 所 有 的 宏 定 义 。 

(2) 处 理 所 有 条 件 编译 指令 ， 如 扩 f、 贡 fdef 等 。 

(3) 处 理 #include 预 编译 指令 ， 将 被 包含 的 文件 插入 该 预 编 译 指 令 的 位 置 。 该 过 程 递归 进行 ， 
被 包含 的 文件 可 能 还 包含 其 他 文件 。 

(4) 删除 所 有 的 注释 /和 /**/) 。 

(5) 添加 行 号 和 文件 标识 ， 以 便于 编译 时 编译 器 产生 调试 用 的 行 号 信息 及 编译 时 产生 编译 错 
误 或 警告 时 能 够 显示 行 号 信息 。 

C6) 保留 所 有 的 #pragma 编译 器 指令 ， 因 为 编译 器 需要 使 用 它们 。 


【 例 2.7】 预 处 理 C 程序 
(1) 打开 UE， 然 后 输入 代码 : 


#include <stdio.h> 


int main(int argc, char *argv[]) 

{ 
char sz[] = "Hello, World!\n"; 
printf("*s", sz); 
fflush(stdout); 
return 0; 


) 
保存 文件 为 test.c。 
(2) 把 test.c 上 传 到 Linux， 并 在 命令 行 下 输入 gcc 预 处 理 命令 : 


CC 有 St CGO test- i 
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选项 “-E” 告 诉 gcc 只 进行 预 处 理 ; “testc” 是 C 源 程序 文件 ，“-o” 用 于 指定 要 生成 的 结果 
文件 ， 后 面 跟 的 就 是 结果 文件 名 字 ; 这 里 输出 的 结果 文件 为 testi， 是 一 个 经 过 预 处 理 后 的 C 代码 
文件 ， 会 把 源 代码 中 的 stdio.h 内 容 编译 进来 ， 因 此 文件 变 长 了 很 多 。 大 家 如 果 要 看 其 内 容 ， 可 以 
在 命令 行 下 输入 cat -n test.i， 加 -n 是 为 了 显示 行 号 ， 文 件 内 容 较 长 ， 我 们 截取 了 最 后 部 分 ， 可 以 看 
到 testi 一 共有 842 行 ， 因 为 把 stdio.h 的 内 容 包含 进来 了 。 





825 extern char *ctermid (char* s) attribute (( nothrow  , leaf )); 
826 4 913 "/usr/include/stdio.h" 3 4 
827 extern void flockfile (FILE * stream) attribute (( nothrow ü 
leaf )); 

828 

829 

830 

831 extern int ftrylockfile (FILE * stream) attribute (( _ nothrow 5 
lesi JL 

832 

833 

834 extern void funlockfile (FILE * stream) attribute (( . nothrow F 
_ leaf )); 

835 # 943 "/usr/include/stdio.h" 3 4 

836 

837 # 2 "test.c" 2 

838 

839 int main() 

840 ( 

841 printf("hello, boy\n"); 

842 } 


从 835 行 可 以 看 到 ，stdio.h 的 路 径 位 于 /usrinclude/ 下 。 

值得 注意 的 是 ， 选 项 “-o” 中 的 o 是 output 的 意思 ， 不 是 目标 的 意思 。-o 后 面 跟 的 是 要 输出 
的 结果 文件 名 称 ， 结果 文件 可 能 是 预 处 理 文件 、 汇 编 文件 、 目 标 文 件 或 者 最 终 的 可 执行 文件 ， 我们 
在 后 续 章节 会 讲 到 -o， 这 里 只 需 了 解 即 可 。 

2. 编译 

编译 过 程 就 是 把 预 处 理 完 的 文件 进行 一 系列 词法 分 析 、 语 法 分 析 、 语 义 分 析 及 优化 后 生成 相 
应 的 汇编 代码 文件 。 在 使 用 gcc 进行 编译 时 , 默认 情况 下 , 不 输出 这 个 汇编 代码 的 文件 。 如 果 需 要 ， 
可 以 在 编译 时 指定 -S 选项 ， 这 样 就 会 输出 同名 的 汇编 语言 文件 。 

gce 对 C 源 文件 编译 后 生成 的 汇编 代码 文件 是 .s 文件 。 我 们 对 上 面 的 testi 进行 编译 : 














[root@localhost test]# gcc -S test.i -o test.s 


选项 “-S” 告 诉 gcc 只 进行 到 编译 阶段 ; “testi” 是 进行 编译 的 源 文件 ，“-o” 用 于 指定 要 生 
成 的 结果 文件 ， 后 面 跟 的 就 是 结果 文件 名 字 ; 这 里 输出 的 结果 文件 为 汇编 文件 tests， 也 就 是 一 个 
文本 文件 ， 里 面包 含 的 是 汇编 语言 源 代码 。 可 以 用 cat 命令 来 查看 tests 中 的 内 容 : 
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[root@localhost test]# cat -n test.s 


1 -file "test.c" 

2 -section -rodata 
SEES 

4 .String "hello, boy" 

5 „text 

6 .globl main 

di .type main, Gfunction 
8 main: 

9 .LFBO: 

10 .cfi startproc 

alat pushq  $rbp 

12 .cfi def cfa offset 16 
13 cfi offset 6, -16 

14 movq $rsp, $rbp 

15 .cfi def cfa register 6 
16 movl $.LCO, $edi 

do call puts 

18 popa $rbp 

19 rafieoes cfa 1 8 

20 ret 

21 -cfi endproc 

22 .LFEO: 

23 -Size main, .-main 

24 -ident "GCC: (GNU) 4.8.5 20150623 (Red Hat 4.8.5-11)" 
25 .Section .note.GNU-stack,"",Gprogbits 


[rootélocalhost test]# 


可 以 看 到 经 过 编译 阶段 后 ，gce 已 经 将 testi 文件 转化 为 汇编 语言 文件 。 汇 编 语言 是 一 种 低级 
的 通用 编程 语言 。 不 同 高 级 语言 的 不 同 编译 器 输出 的 汇编 语言 几乎 相同 ， 例 如 C 和 Fortran 在 此 步 
编译 产生 的 输出 文件 都 是 一 样 的 汇编 语言 。 

3. 汇编 

汇编 就 是 将 汇编 代码 转变 成 机 器 可 以 执行 的 二 进 制 代码 ， 每 一 个 汇编 语句 几乎 都 对 应 一 条 机 
器 指令 。 汇 编 相 对 于 编译 过 程 比较 简单 ， 根 据 汇编 指令 和 机 器 指令 的 对 照 表 一 一 翻译 即 可 。 

gec 生成 的 二 进 制 代码 文件 为 后 缀 名 为 .o 的 文件 。 我 们 对 上 面 的 testis 进行 汇编 : 


[root@localhost test]# gcc -c test.s -o test.o 


选项 “-c” 告 诉 gcc 只 进行 到 汇编 处 理 为 止 ，“test.s” 是 进行 汇编 的 源 文件 ，“-o” 用 于 指定 
要 生成 的 结果 文件 ， 后 面 跟 的 就 是 结果 文件 名 字 ; 这 里 输出 的 结果 文件 为 目标 文件 test.o， 是 一 个 
二 进 制 文件 (不 是 文本 文件 ) ， 在 Windows 上 通常 就 是 obj 文件 。test.o 是 二 进 制 文件 ， 可 以 用 命 
4 hexdump 来 查看 : 

[root@localhost test]# hexdump test.o 

0000000 457f 464c 0102 0001 0000 0000 0000 0000 

0000010 0001 003e 0001 0000 0000 0000 0000 0000 

0000020 0000 0000 0000 0000 0130 0000 0000 0000 


0000030 0000 0000 0040 0000 0000 0040 000d 000a 
0000040 4855 e589 00bf 0000 e800 0000 0000 c35d 
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0000050 6568 6c6c 2c6f 6220 796f 0000 4347 3a43 
0000060 2820 4e47 2955 3420 382e 352e 3220 3130 
0000070 3035 3236 2033 5228 6465 4820 7461 3420 
0000080 382e 352e 312d 2931 0000 0000 0000 0000 
0000090 0014 0000 0000 0000 7a01 0052 7801 0110 
00000a0 0clb 0807 0190 0000 001c 0000 001c 0000 
00000b0 0000 0000 0010 0000 4100 100e 0286 0d43 


4. 链接 
在 成 功 汇编 之 后 ， 就 进入 了 链接 阶段 。 链 接 主要 是 为 了 解决 多 个 文件 之 间 符 号 引用 的 问题 
(symbol resolution) 。 编 译 时 编译 器 只 对 单个 文件 进行 处 理 ， 如 果 该 文件 里 面 需要 引用 到 其 他 文 
件 中 的 符号 〈 例 如 全 局 变量 或 者 某 个 函数 库 中 的 函数 )， 那 么 这 时 在 这 个 文件 中 该 符号 的 地 址 是 没 
法 确定 的 , 只 能 等 链接 器 把 所 有 的 目标 文件 连接 到 一 起 才能 确定 最 终 的 地 址 , 最 终生 成 可 执行 的 文 
件 。 当 所 有 的 目标 文件 都 生成 之 后 ，gcc 就 在 内 部 调用 链接 器 ld 来 完成 链接 工作 。 在 链接 阶段 ， 所 
有 的 目标 文件 被 安排 在 可 执行 程序 中 的 恰当 位 置 。 值 得 注意 的 是 , 在 Linux 系统 中 ， 可 执行 文件 没 
有 统一 的 后 绥 ， 系 统 从 文件 的 属性 来 区 分 可 执行 文件 和 不 可 执行 文件 。 
这 里 要 介绍 一 下 函数 库 。 我 们 可 以 回头 看 C 源 程序 ， 程 序 中 并 没有 定义 “printf ”的 函数 实现 ， 
且 在 预 编 译 中 包含 进 的 “stdio.h” 中 也 只 有 该 函数 的 声明 ， 而 没有 定义 函数 的 实现 。GNU 组 织 把 
这 些 函 数 实 现 都 放 到 名 为 libc.so.6 的 库 文 件 中 去 了 ， 该 文件 是 GNU 的 标准 C 函数 库 ， 里 面 实现 了 
printf. gec 会 到 系统 默认 的 搜索 路 径 “/usr/lib64” 下 查找 libc.so.6, 然后 就 可 以 发 现 printf 在 libc.so.6 
中 的 实现 ， 这 样 printf 函数 的 地 址 就 确定 了 ， 即 printf 符号 的 引用 问题 解决 了 ， 就 不 会 报 出 链接 时 
候 的 错误 ， 比 如 找 不 到 函数 实现 等 。 这 就 是 链接 的 作用 。 喝 唆 一 句 ，libc.so.6 是 Linux 下 的 GUN C 
函数 库 (glibc) ， 是 gcc 在 编译 时 默认 使 用 的 C. 函数 库 。 我 们 可 以 通过 下 列 方式 来 查看 当前 系统 
上 的 glibe 的 版 本 : 
[root@localhost lib64]# /lib64/libc.so.6 
GNU C Library (GNU libc) stable release version 2.17, by Roland McGrath et al. 
Copyright (C) 2012 Free Software Foundation, Inc. 
This is free software; see the source for copying conditions. 
There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A 
PARTICULAR PURPOSE. 
Compiled by GNU CC version 4.8.5 20150623 (Red Hat 4.8.5-4). 
Compiled on a Linux 3.10.0 system on 2015-11-19. 
Available extensions: 
The C stubs add-on version 2.1.2. 
crypt add-on version 2.1 by Michael Glad and others 
GNU Libidn by Simon Josefsson 
Native POSIX Threads Library by Ulrich Drepper et al 
BIND-8.2.3-T5B 
RT using linux kernel aio 
libc ABIs: UNIQUE IFUNC 
For bug reporting instructions, please see: 
Xhttp://www.gnu.org/software/libc/bugs.html». 
可 以 看 到 ， 当 前 gibe 的 版 本 是 2.17. $E, /libe4 是 一 个 文件 夹 链接 ， 它 的 真实 文件 夹 是 
/usrlib64。glibc 是 GNU 组 织 对 C 的 标准 实现 库 ， 是 操作 系统 UNIX/Linux 的 基石 之 一 。 微 软 也 有 
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自己 的 C 标准 实现 库 ， 叫 msvert; 嵌入 式 行业 里 还 常用 uClibc， 是 一 个 迷你 版 的 C 标准 实现 库 。 
言 归 正 传 ， 我 们 对 上 面 生 成 的 testo 进行 链接 : 


[root@localhost test]# gcc test.o -o test 


这 里 只 有 一 个 目标 文件 ， 如 果 有 多 个 目标 文件 Co 文件 ) 可 以 写 在 一 起 ， 每 两 个 目标 文件 之 间 
加 空格 ， 比 如 gcc testl.o test2.0 test3.0 -o test. 
运行 后 ， 将 最 终生 成 可 执行 文件 test， 我 们 可 以 运行 它 : 





[root@localhost test]# ./test 

hello, boy 

运行 成 功 ， 输 出 “hello, boy" o ZHE, gee 内 部 工作 的 几 个 阶段 都 完成 了 。 实 际 开发 的 时 候 ， 
当然 不 需要 这 样 麻烦 ， 只 需要 gce test.c -o test 就 会 生成 可 执行 文件 test， 而 且 并 不 会 输出 那些 中 间 
文件 。 这 里 介绍 它 的 过 程 只 是 让 大 家 明白 内 部 工作 原理 。 


2.8.2 gcc 所 支持 的 后 缀 名 文件 

EH gcc 内 部 工作 的 过 程 中 产生 了 不 少 中 间 文 件 。gcc 可 以 针对 支持 的 不 同 源 程序 文件 进行 不 
同 的 处 理 ， 文 件 格 式 以 文件 的 后 绥 来 识别 ， 即 gec 通过 文件 后 绥 来 区 别 输 入 文件 的 类 型 。 下 面 用 表 
格 〈 见 表 2-3) 归纳 一 下 gcc 所 支持 的 具有 不 同 后 缀 名 的 文件 ， 这 些 文件 可 能 是 gee 工作 中 某 个 步 
又 所 产生 的 。 


表 2-3 gcc 所 支持 的 具有 不 同 后 组 名 的 文件 
后 缀 名 文件 类 型 后 续 编译 流程 
uem. nit 
mum. n 





CUEBULREIS Crt 源 代码 文件 


汇编 语言 源 代码 文件 





经 过 预 编译 的 汇编 语言 源 代码 文件 
由 目标 文件 构成 的 档案 库 文 件 (静态 库 ) 
编译 后 的 目标 文件 二进制 文 件 ) 














当然 , 我 们 平时 不 经 常 和 所 有 的 后 级 名 文件 打交道 。 使 用 gee 的 时 候 , 基本 上 就 是 输入 源 文件 ， 
得 到 可 执行 文件 。 


2.8.8 gcc 的 语法 格式 
gcc 编译 器 的 基本 语法 格式 如 下 : 
gcc [选项 ] 准备 编译 的 文件 [选项 ] [目标 文件 ] 
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要 注意 5 个 部 分 之 间 都 有 空格 。 选 项 较 多 ， 后 面 章节 会 详细 阐述 。 准 备 编译 的 文件 除了 是 C 
或 CPP 源 文 件 外 ， 也 可 能 是 汇编 代码 文件 〈.s 文件 ) 。 如 果 目 标 文件 没有 指明 ， 就 自动 生成 a.out。 

常用 的 使 用 方式 是 gce test.c -o test， 直 接 将 test.c 编译 生成 可 执行 文件 test。 比 较 简洁 的 使 用 
方式 是 gcctestc， 这 样 生 成 的 可 执行 文件 是 a.out。 

下 面 我 们 来 看 一 个 简单 的 例子 ， 编 译 一 个 C 程序 。 这 里 的 “编译 ”不 是 前 面 gcc 第 二 个 工作 
阶段 的 “编译 ”， 而 是 从 预 处 理 到 链接 再 到 生成 可 执行 程序 ， 就 是 一 种 习惯 说 法 ， 大 家 心里 清楚 即 
可 。 


【 例 2.8】 使 用 gcc 编译 一 个 C 程序 
CD 新 建 一 个 C 源 文件 testc， 内 容 如 下 : 





#include <stdio.h> 


int main() 

t 
printf("hello, boy Wn" ); 
return 0; 


} 
很 简单 的 一 个 C 程序 。 
(2) 进入 test.c 所 在 目录 ， 用 gcc 开始 编译 ， 然 后 运行 : 


[root@localhost test]# gcc test.c -o test 
[rootélocalhost test]# ./test 
hello, boy 
可 以 发 现 ， 程 序 运行 成 功 了 ， 输 出 了 结果 “hello,boy”。 这 个 程序 没什么 难度 ， 但 大 家 可 以 通 
过 这 个 程序 来 检查 系统 安装 的 gcc 是 否 可 用 。 
gcc 除了 可 以 编译 C 程序 外 ， 也 可 以 用 来 编写 C++ 程序 ， 下 面 我 们 来 看 一 个 例子 。 
【 例 2.9】 使 用 gcc 编译 一 个 不 需要 C++ 库 的 C++ 程序 
(1) 新 建 一 个 C++ 源 文件 testcpp， 内 容 如 下 : 


#include <stdio.h> 


int main() 

t 
bool b-false; 
printf("hello, boy Mn" ); 
return 0; 


n 


程序 中 使 用 了 C++ 的 关键 字 bool， 因 此 如 果 把 文件 命名 为 testc， 再 用 gcc 去 编译 就 会 报错 ， 
因为 C 语言 里 没有 bool 类 型 。 现 在 我 们 命名 文件 名 后 缀 cpp, gce 就 认为 是 一 个 C++ 程序 了 。 








(2) 进入 testcpp 所 在 目录 ， 用 gce 开始 编译 ， 然 后 运行 : 
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[root@localhost test]# gcc test.cpp -o test 
[rootélocalhost test]# ./test 
hello, boy 


gcc 对 C++ 文件 成 功 编译 ， 输 出 结果 “hello,boy”。sgcc 编译 C 和 编译 C++ 似乎 命令 行 很 相似 。 
其 实 不 然 ， 我 们 现在 的 testcpp 并 没有 使 用 C++ 标准 库 里 的 内 容 。 如 果 调 用 了 C++ 标准 库 里 面 的 函 
数 ， 情 况 就 不 同 了 ， 请 看 下 例 。 
【 例 2.10】 使 用 gcc 编译 一 个 需要 C++ 库 的 C++ 程序 
CD 新 建 一 个 C++ 源 文件 test.cpp， 内 容 如 下 : 





#include <iostream> 

using namespace std; 

int main() 

t 
bool b - false; 
cout«« "hello, boy Wn"; 
return 0; 


H 
其 中 ，std 是 命名 空间 ; cout 是 std 中 的 对 象 ， 用 于 打印 输出 。 这 段 程序 使 用 Ceci HE H 
的 cout 来 输出 内 容 。 


C2) 进入 test.cpp 所 在 目录 ， 用 gcc 开始 编译 ， 然 后 运行 : 


HE 
El 





[rootGlocalhost test]# gcc test.cpp -lstdc++ -o test 

[rootélocalhost test]# ./test 

hello, boy 

因为 用 到 了 C++ 标准 库 里 的 内 容 ， 所 以 我 们 需要 用 gee 的 选项 -1 来 链接 C++ 标准 库 stdc++， 如 
果 没 有 这 个 选项 ， 将 会 报错 。 关 于 -1 后 面 会 讲 到 。 





2.84 gcc 常见 选项 

gcc 选项 有 上 百 个 ， 当 然 很 多 都 用 不 着 ,我 们 只 需要 熟悉 一 些 常 见 的 即 可 。 虽 然 现在 gce 的 选 
项 繁多 , 但 gee 刚 诞 生 的 时 候 才 只 有 4 个 选项 ， 它 就 像 一 个 人 的 成 长 过 程 ， 功 能 越 来 越 强 大 。 现 在 
gcc 已 经 成 为 开源 编译 器 的 “一 哥 ”。 下 面 介绍 几 个 常见 的 选项 。 注 意 ，gcc 的 选项 是 区 分 大 小 写 
的 ， 比 如 -o 和 -O 的 含义 完全 不 同 ， 前 者 是 生成 一 个 结果 文件 ， 后 者 表示 对 生成 的 可 执行 文件 进行 
一 级 优化 。 

1. 没有 任何 选项 

不 用 任何 选项 ， 结 果 会 在 与 源 文件 test.c 相同 的 目录 下 产生 一 个 aout 可 执行 文件 。 比 如 gec 
test.c， 将 生成 可 执行 文件 a.out。 

2. 选项 -x 

选项 -x 可 以 告诉 gee 要 编译 的 源 文件 是 什么 语言 文件 ， 而 不 用 根据 其 后 缀 去 判断 ;或 者 也 可 
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以 告诉 gee 需要 开始 根据 源 文件 后 绥 名 来 判断 语言 类 型 了 。 


(1) -xlanguage filename 

language 和 filename 都 是 选项 x 的 参数 , 告诉 gcc 源 文件 (filename) 所 使 用 的 语言 为 language， 
使 后 级 名 无 效 。 这 样 设 定 后 ， 对 以 后 的 源 文件 都 这 样 处 理 ， 一 直 等 到 再 次 调用 -x 来 关闭 。 默 认 情 
况 下 , gcc 是 根据 源 文件 后 级 名 来 判断 源 文件 语言 的 , 比如 根据 .c 来 知道 是 C 语言 的 代码 , 根据 .cpp 
后 级 名 知道 要 编译 的 源 代码 是 C++ 语言 的 。 为 了 满足 个 性 化 需求 , 有 些 同 学 希望 用 .pig 作为 C 源 代 
码 文件 的 后 级 名 ， 此 时 这 个 选项 就 可 以 派 上 用 场 了 。 

参数 language 可 以 使 用 下 列 选项 : 


'c', 'objective-c', 'c-header', 'ctt', 'cpp-output', 'assembler', and 
'assembler-with-cpp'. 


看 到 英文 ， 应 该 可 以 理解 所 代表 的 编程 语言 ， 比 如 : 
gcc -x c test.pig 


值得 注意 的 是 , 使 用 -x 之 后 ， 下 次 不 再 使 用 -x 的 时 候 ，gce 依然 会 根据 后 级 名 来 判断 源 文件 的 
语言 类 型 。 比 如 我 们 定义 了 这 样 一 个 源 文件 test'c: 


#include «stdio.h» 


int main() 
t 

printf("hello, boy\n"); 
) 


首先 用 -x 指定 汇编 语言 来 编译 : 


[root@localhost test]# gcc -x assembler test.c 

test.c: Assembler messages: 

test.c:3: Error: junk ^()' after expression 

test.c:3: Error: operand size mismatch for `int' 

test.c: Error: junk at end of line, first unrecognized character is `{' 
test.c:6: Error: invalid character '(' in mnemonic 

test.c:7: Error: junk at end of line, first unrecognized character is `}' 


出 现 了 一 堆 错误 ， 因 为 test.c 中 不 是 汇编 语言 。 下 面 不 再 用 -x 来 编译 : 


va ww 


[root@localhost test]# gcc test.c -o test 
[rootélocalhost test]# ./test 
hello, boy 


gcc 就 能 根据 后 级 名 来 判断 它 是 一 个 C 语言 文件 ， 并 正确 编译 了 。 为 了 进一步 证 实 , 我们 可 以 
在 test.c 中 加 入 C++ 的 关键 字 bool， 文 件 内 容 变 为 : 


#include <stdio.h> 


int main() 
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t 

bool b-false; 
printf("hello, boyMn"); 

H 

再 进行 编译 : 


[root@localhost test]f gcc test.c -o test 
test.c: RŽ ‘main’ 中: 
test.c:5:2: 错误 : 未 知 的 类 型 名 “bool” 

bool b = false; 


^ 


test.c:5:11: 错误 : ‘false’ REH (在 此 函数 内 第 一 次 使 用 ) 
bool b = false; 


^ 


test.c:5:11: 附注 每 个 未 声明 的 标识 符 在 其 出 现 的 函数 内 只 报告 一 次 
gcc 认为 C 语言 中 没有 bool 类 型 。 我 们 把 teste 改 为 test.cpp， 再 编译 : 


[root@localhost test]# gcc test.cpp -o myt 
[rootelocalhost test]# ./myt 
hello, boy 


能 正确 编译 了 。 不 改 后 缀 名 也 可 以 ， 使 用 -x ct+， 比 如 : 


rootélocalhost test]# gcc -x c++ test.c 
[rootélocalhost test]# ./test 
hello, boy 


3. 选项 -o 

选项 -o 用 于 指定 要 生成 的 结果 文件 ， 后 面 跟 的 就 是 结果 文件 名 字 。o 是 output 的 意思 , 不 是 目 
标的 意思 。-o 后 面 跟 的 是 要 输出 的 结果 文件 名 称 ， 结 果 文 件 可 能 是 预 处 理 文件 、 汇 编 文 件 、 目 标 
文件 或 者 最 终 的 可 执行 文件 。 

比如 : 


gce =S testi -o test.s 


将 生成 汇编 文件 test.s。 
再 比如 : 


gcc -c test.cpp -o test 


将 生成 二 进 制 目标 文件 test。 注 意 ,这 个 test 是 目标 文件 ,不 是 可 执行 文件 ,我 故意 没有 写 testo, 
就 是 要 引起 大 家 的 重视 ， 不 要 看 到 没有 后 级 就 习惯 性 视 为 可 执行 文件 。 因 为 这 里 用 了 -ce， 告 诉 gec 
到 汇编 阶段 为 止 ， 不 要 进行 链接 ， 所 以 不 会 生成 可 执行 文件 ，-c 下 面 会 讲 到 。 当 然 这 里 也 可 以 写 
成 : 





gcc -c test.cpp -o test.o 
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将 生成 二 进 制 目标 文件 test.o。 
再 比如 : 


gcc test.c -o test 

将 生成 可 执行 文件 test。 

4. 选项 -c 

选项 -c 告诉 gec 对 源 文件 进行 编译 和 汇编 ,但 不 进行 链接 。 此 时 ,将 生成 目标 文件 ， 如 果 没有 
指定 输出 文件 名 ， 就 生成 同名 的 .o 文件 ， 比 如 我 们 对 上 面 的 test.cpp 文件 进行 编译 、 汇 编 : 

[rootélocalhost test]# gcc -c test.cpp 


[rootQlocalhost test]# ls 
test.cpp test.o 


可 以 看 到 ， 生 成 目标 文件 test.o。 我 们 也 可 以 指定 目标 文件 名 ， 比 如 : 


[root@localhost test]# gcc -c test.cpp -o test 
[root@localhost test]# ls 
test test.cpp test.o 


我 们 用 -o 指定 生成 的 目标 文件 为 test。 注 意 ， 它 不 是 可 执行 文件 (因为 没有 进行 链接 ) ， 所 以 
是 无 法 运行 的 。 比 如 : 

[root@localhost test]# ./test 

-bash: ./test: 权限 不 够 

[root@localhost test]# chmod +x test 

[root@localhost test]# ./test 

-bash: ./test: 无 法 执行 二 进 制 文件 

提示 我 们 无 法 执行 二 进 制 文件 ,此 时 test 和 testo 中 的 内 容 其 实 是 一 样 的 , 我 们 可 以 用 md5sum 
命令 来 比较 : 

[root@localhost test]# md5sum test.o 

£968a405749d04f035ecfcbb89d2346f test.o 

[root@localhost test]# md5sum test 

£968a405749d04f035ecfcbb89d2346f test 

可 以 看 到 ， 这 两 个 文件 的 mds 校 验 值 是 一 样 的 ， 说 明 这 两 个 文件 内 容 是 一 样 的 。 这 说 明 指 定 
了 -c 选项 后 ， 生 成 的 就 是 二 进 制 目标 文件 ， 而 不 是 可 执行 文件 。 值 得 注意 的 是 ， 当 有 多 个 源 文件 
时 ，-c 将 为 每 个 源 文件 生成 一 个 .o 文件 ， 而 且 此 时 是 不 能 使 用 -o 的 。 下 面 我 们 增加 两 个 cpp 文件 
testl.cpp 和 test2.cpp。testl.cpp 内 容 如 下 : 

#include <stdio.h> 

int tro 

{ 


bool b = false; 
printf("hello, boy\n"); 
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test2.cpp 内 容 如 下 : 


#include <stdio.h> 
int t2() 
t 
bool b - false; 
printf("hello, boy\n"); 
) 


然后 进行 -c 编译 和 汇编 : 


[root@localhost test]# ls 

testl.cpp test2.cpp test.cpp 

[rootelocalhost test]# gcc -c test.cpp testl.cpp test2.cpp 
[rootQlocalhost test]# ls 

testl.cpp testl.o test2.cpp test2.0 test.cpp test.o 


可 以 看 到 分 别 生成 了 3 个 .o 文件 。 如 果 我 们 企图 用 -o， 就 会 报错 : 


[rootélocalhost test]# gcc -c test.cpp testl.cpp test2.cpp -o test.o 

gcc: 致命 错误 : 当 有 多 个 文件 时 ， 不 能 在 已 指定 -c R -s 的 情况 下 指定 -o 

编译 中 断 。 

注意 ， 这 是 在 有 -c 的 情况 下 ， 所 以 用 -o 会 出 现 这 样 的 提示 。 如 果 我 们 要 直接 生成 可 执行 文件 
〈 不 用 -ce) ， 即 使 有 多 个 源 文件 ，-o 也 是 可 用 的 。 比 如 : 


[root@localhost test]# gcc test.cpp testl.cpp test2.cpp -o test 

[rootélocalhost test]# ls 

test testl.cpp test2.cpp test.cpp 

[rootGlocalhost test]# ./test 

hello, boy 

5. 选项 -| 

选项 -1 (i 的 大 写 ) 用 来 指定 头 文件 所 在 文件 夹 的 路 径 ， 用 法 为 -L dirPath. 

如 果 源 代码 中 用 尖 括 号 包含 头 文件 ，gce 就 会 先 在 -I 指定 的 路 径 中 搜索 所 需 的 头 文件 ， 若 找 不 
到 ， 则 到 标准 默认 路 径 /usr/local/include 下 搜索 ， 若 还 找 不 到 ， 再 到 标准 默认 路 径 /ust/include 下 搜 
索 ， 若 再 找 不 到 ， 则 报错 (而 不 会 再 到 当前 工作 目录 搜索 ， 即 使 当前 工作 目录 有 所 需 头 文件 ) 。 后 
面 的 例子 会 验证 这 一 点 。 

如 果 源 代码 中 用 双 引 号 包含 头 文件 ，gce 就 会 先 在 当前 工作 目录 (和 源 文件 同一 目录 ) 进行 寻 
找 ， 如 果 没 有 找到 ， 就 到 -I 所 指定 的 路 径 下 寻找 ， 若 找 不 到 ， 则 到 标准 默认 路 径 /usr/local/include 
下 搜索 ， 若 还 找 不 到 ， 再 到 标准 默认 路 径 /usr/include 下 搜索 ， 若 再 找 不 到 ， 则 会 报错 。 


【 例 2.11】 选 项 -| 的 基本 使 用 
A) 打开 crt， 连 接 虚拟 机 Linux， 新 建文 件 夹 /zww/inc: 








mkdir -p /zww/inc 


-p 的 意思 是 如 果 父 目录 不 存在 ， 就 先 创建 父 目 录 ， 再 创建 子 目录 ， 即 如 果 /zww 不 存在 ， 就 先 
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创建 zwvw， 再 创建 子 目录 inc. 
(2) 进入 /zww/inc， 然 后 用 vi 新 建 一 个 头 文件 testh 并 保存 。testh 内 容 如 下 : 
#define ZW 8 // 就 一 行 代码 ， 定 义 了 宏 ZWwW 
G) 新 建 目录 /zww/test， 并 在 该 目录 下 新 建 一 个 test.cpp 并 保存 ，test.cpp 内 容 如 下 : 


#include <stdio.h> 

#include «test.h» 

int main() 

t 
bool b - false; 
printf("hello, boy:$dWn",ZWW); //5|H f zwwix4 
return 0; 


) 
(4). 进入 /zww/test 下 ， 然 后 编译 test.cpp 并 运行 : 


[root@localhost test]# gcc test.cpp -I /zww/inc -o test 

[rootQlocalhost test]# ./test 

hello, boy:8 

我 们 在 编译 的 时 候 ， 使 用 了 -LI， 人 告诉 gcc 首先 到 目录 /zww/inc 下 去 寻找 test.cpp 所 需 的 头 文件 。 
大 家 可 以 试 试 ， 若 把 -1/zww/inc 去 掉 ， 则 将 报错 。 

下 面 再 介绍 一 下 搜索 的 顺序 。 大 家 学 #include 的 时 候 都 知道 它 有 两 种 包含 方式 ， 一 种 是 尖 括 号 
包含 头 文件 ， 另 一 种 是 双 引 号 包含 头 文件 。 比 如 : include <test.h> 和 #include"test.h"。 使 用 尖 插 号 
包含 指示 gee 预 处 理 程序 到 预定 义 的 默认 路 径 下 《〈 比 如 -I/zww/inc F) 寻找 文件 。 预 定义 的 默认 路 
径 通常 是 在 选项 -[ 中 指定 的 路 径 ， 如 果 未 找到 ， 就 到 /usrinclude 目录 下 继续 寻找 ， 如 果 还 找 不 到 ， 
就 到 当前 目录 下 继续 寻找 。 

【 例 2.12】 验 证 尖 括 号 包含 时 的 搜索 次 序 

(1) 在 上 例 的 基础 上 ， 我 们 把 testh 复制 一 份 到 test.cpp 同一 目录 下 ， 即 /zww/test。 然 后 把 
/zww/inc 下 的 test.h 修改 为 : 





#define ZWW 7 
(20 进入 /zww/test， 然 后 编译 test.cpp 并 运行 : 
[root@localhost test]# gcc test.cpp -I /zww/inc -o test 
[rootélocalhost test]# ./test 
hello, boy:7 
可 以 发 现 ， 打 印 输出 的 是 7， 说 明 gcc 先 找到 的 是 /zww/inc 下 的 test.h. 
(3) 进入 /zww/inc， 把 /zww/inc 下 的 test.h 剪 切 到 /usrinclude F: 


mv test.h /usr/include 
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这 样 /zww/inc 下 就 没有 testh 了 。 此 时 再 进入 /zww/test， 然 后 编译 test.cpp 并 运行 : 


[root@localhost inc]# cd /zww/test 

[rootélocalhost test]# gcc test.cpp -I /zww/inc -o test 
[rootGlocalhost test]# ./test 

hello, boy:7 


可 以 发 现 依旧 能 输出 7, 说 明 gcc 虽然 在 /zww/inc 下 找 不 到 test.h, 但 会 马上 去 /usr/include FER, 
找到 了 就 停止 继续 搜索 ， 所 以 与 test.cpp 同 目录 的 testh 并 没 用 。 


(4) 复制 一 份 /usr/include 下 的 test.h 到 /usr/local/include: 

cp /usr/include/test.h /usr/local/include 

并 通过 vi 命令 修改 /usr/local/include/test.h 的 内 容 : 

#define ZWW 9 

进入 /zww/test， 然 后 编译 test.cpp 并 运行 : 

[root@localhost test]# gcc test.cpp -I /zww/inc -o test 

[rootQlocalhost test]# ./test 

hello, boy:9 

可 以 发 现 打印 了 9， 这 说 明 gcc HIRR T /usr/local/include, RWA test.h 就 用 它 了 。 
C5) 把 所 有 testh 都 删除 ， 除 了 当前 工作 目录 外 。 


[root@localhost lib]# rm -f /usr/include/test.h /usr/local/include/test.h 
/zww/inc/test.h 


进入 /zww/test， 然 后 编译 test.cpp 并 运行 : 


[rootélocalhost lib]# cd /zww/test 
[rootélocalhost test]# gcc test.cpp -I /zww/inc -o test 
test.cpp:2:18: 致命 错误 : test.h: 没有 那个 文件 或 目录 


#include «test.h» 


^ 


编译 中 断 。 


可 以 发 现 ， 提 示 找 不 到 testh， 而 /zwwy/test 目录 下 的 test.h 是 存在 的 ， 说 明 尖 括号 包含 的 头 文 
件 不 会 到 当前 工作 目录 下 去 寻找 。 


【 例 2.13】 验 证 双 引 号 包含 时 的 搜索 次 序 

(1) 在 /zww/test 下 新 建 test.h， 内 容 是 : 

#define ZWW 8 

(2) 新 建文 件 夹 zwwline, fE/zww/inc 下 新 建 test.h， 内 容 是 : 


#define ZWW 9 
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(3) fE/usr/local/include 下 新 建 test.h， 内 容 是 : 
#define ZWW 10 

(4) 在 /usrinclude 下 新 建 test.h， 内 容 是 : 
#define ZWW 11 

(5) fE/zwwhtest 下 建立 源 文件 test.cpp， 内 容 是 : 


#include <stdio.h> 
#include "test.h" // 注 意 是 双 引 号 
int main() 
t 
bool b - false; 
printf("hello, boy:$dWMn",ZWW); 
return 0; 


} 
在 /zww/test 下 进行 编译 并 运行 : 


[root@localhost ~]# cd /zww/test 

[root@localhost test]# gcc test.cpp -I /zww/inc -o test 
[root@localhost test]# ./test 

hello, boy:8 


可 以 发 现 ， 输 出 的 是 8， 说 明 使 用 的 是 /zww/test， 即 当前 工作 目录 下 的 头 文件 。 
(6) 把 当前 工作 目录 /zww/test 下 的 testh 删除 ， 再 进行 编译 运行 : 


[rootélocalhost test]# gcc test.cpp -I /zww/inc -o test 
[rootélocalhost test]# ./test 
hello, boy:9 


结果 打印 的 是 9， 即 使 用 的 是 /zww/inc 中 的 testh。 说 明 双 引号 包含 时 ， 如 果 在 当前 工作 目录 
下 没有 找到 所 需 头 文件 ， 就 到 -I 所 包含 的 路 径 下 去 寻找 。 


CD. 我 们 把 /zww/inc 下 的 test.h 也 删除 ， 再 进入 /zww/test 去 编译 运行 : 


[root@localhost test]# cd /zww/inc 

[root@localhost inc]# ls 

test.h 

[rootelocalhost inc]# rm -f test.h 

[rootelocalhost inc]# cd /zww/test 

[rootélocalhost test]# gcc test.cpp -I /zww/inc -o test 
[rootélocalhost test]# ./test 

hello, boy:10 


可 以 发 现 打 印 的 是 10， 说 明 使 用 的 是 /usr/local/include 下 的 test.h。 


二 


(8) 我 们 把 /usr/local/include 下 的 test.h 删除 ， 再 进入 /zwwltest 去 编译 运行 : 
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[root@localhost test]# cd /usr/local/include 

[root@localhost include]f$ rm -f test.h 

[rootélocalhost include]£ cd /zww/test 

[root@localhost test]# gcc test.cpp -I /zww/inc -o test 

[rootQlocalhost test]# ./test 

hello, boy:11 

可 以 发 现 打 印 的 是 11， 说 明 gcc 使 用 了 /usr/include 下 的 testh。 如 果 再 把 这 个 头 文件 删除 ， 就 
会 提示 找 不 到 testh。 大 家 可 以 试 一 下 。 

这 两 个 例子 主要 是 为 了 让 大 家 了 解 尖 括号 包含 和 双 引 号 包含 的 不 同 搜索 次 序 ， 尤 其 是 在 指定 
了 -I 的 情况 下 。 以 后 实际 开发 大 型 软件 时 ,会 有 很 多 同名 的 头 文件 ， 清 楚 调用 的 是 哪里 的 头 文件 是 
非常 重要 的 。 

6. 选项 -include 

gcc 命令 行 中 也 能 包含 头 文件 。 很 多 开源 软件 都 是 这 样 的 ， 有 时 候 开 源 软件 源码 中 找 不 到 
“#include <xxx.h>” 这 样 的 代码 ， 而 xxx.h 的 内 容 又 确实 被 引用 了 ， 是 不 是 很 奇怪 ? 这 就 是 选项 
-include 搞 的 鬼 。 在 gcc 编译 时 通过 -include 来 保护 xxx.h。 看 到 这 里 一 定 要 留 个 印象 。 做 Linux 的 
以 后 肯定 会 研究 开源 软件 源码 工程 ， 那 时 在 源码 中 找 不 到 “包含 头 文件 ”的 代码 时 , 希望 能 回忆 起 
现在 强调 的 内 容 。 因 为 不 知道 gee 命令 行 能 包含 头 文件 而 浪费 精力 的 事件 太 多 ,教训 之 谈 , 希望 大 

选项 -include 的 使 用 方式 : 











gcc [srcfile] -include [headfile] 
用 起 来 很 简单 ， 只 需要 加 个 头 文件 即 可 〈 可 以 使 用 绝对 路 径 或 相对 路 径 ) 。 例 子 胜 于 雄辩 ， 请 
看 下 例 。 
【 例 2.14】 在 gcc 命令 行 包含 头 文件 ， 而 不 在 源码 中 包含 头 文件 
(1) 新 建文 件 夹 zww/inc， 在 /zww/inc 下 新 建 test.h， 内 容 是 : 
#define ZWW 9 
(2) 在 /zwwltest 下 建立 源 文件 test.cpp， 内 容 是 : 


#include <stdio.h> 

// 注 意 : 本 文件 没有 包含 test.h 

int main() 

i 
bool b - false; 
printf("hello, boy:$dWMn",ZWW); 
return 0; 


) 
TE/zwwltest 下 进行 编译 并 运行 : 


[root@localhost ~]# cd /zww/test 
[root@localhost test]f gcc test.cpp -include /zww/inc/test.h -o test 
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[rootélocalhost test]# ./test 
hello, boy:9 


打印 的 是 9，gcec 使 用 了 /zww/inc/ 下 的 test.h。 
7. 选项 -Wall 
选项 -Wall 显示 所 有 警告 信息 。 看 它 的 字面 意思 就 知道 ，Warn all， 显 示 所 有 警告 。 
【 例 2.15】gcc 显示 警告 信息 
(1) fE/zww/test 下 新 建 testcpp， 内 容 如 下 : 


#include <stdio.h> 


int main() 
{ 
bool b = false; 


int i; 
printf("hello, boy:%d\n",i); // 没 有 赋值 就 开始 使 用 
return 0; 


H 
(20 在 命令 行 下 ， 进 入 /zwwltest 并 编译 : 


[root@localhost test]# gcc test.cpp -Wall -o test 

test.cpp: 在 函数 'int main() ' 中 : 

test.cpp:5:7: 警告 : 未 使 用 的 变量 'b' [-Wunused-variable] 
bool b = false; 


^ 


test.cpp:7:29: 警告 : 此 函数 中 的 'i' 在 使 用 前 未 初始 化 [-Wuninitialized] 
printf("hello, boy:%d\n",i); 


[root@localhost test]# 

可 以 看 到 ，gcc 显示 了 2 条 经 过 信息 ， 一 条 是 “未 使 用 的 变量 'b'”， 另 一 条 是 “此 函数 中 的 
在 使 用 前 未 初始 化 ”。 如 果 我 们 编译 时 不 用 -Wall， 这 两 条 警告 信息 就 不 会 显示 。 

8. 选项 -g 

选项 -g 可 以 产生 供 gdb 调试 用 的 可 执行 文件 ， 即 可 执行 文件 中 包含 可 供 gdb 调试 器 进行 调试 
所 需 的 信息 。 因 此 ， 加 了 这 个 选项 后 ， 产 生 的 可 执行 文件 尺寸 要 大 些 。 关 于 gdb 后 面 会 讲 到 。 

【 例 2.16】 使 用 -g 后 生成 的 可 执行 文件 更 大 

CD 新 建 一 个 源 文件 test.cpp， 内 容 如 下 : 


#include <stdio.h> 


int main() 
t 
bool b - false; 
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printf("hello, boy Mn" ); 
return 0; 
} 


(2) 进入 test.cpp 所 在 目录 ， 然 后 在 命令 行 下 带 上 -g 选项 后 编译 : 
[rootQlocalhost test]# gcc test.cpp -g -o test 
再 在 命令 行 下 不 带 上 -g 选项 后 编译 : 
[root@localhost test]# gcc test.cpp -o testNoDebugInfo 
分 别 生 成 了 可 执行 文件 test 和 testNoDebugInfo， 然 后 用 Is -1 来 查看 它们 的 大 小 : 


[root@localhost test]# ls -1 

总 用 量 28 

-rwxr-xr-x. 1 root root 9624 11 月 11 21:47 test 
-rwxr-xr-x. 1 root root 124 11 月 11 21:47 test.cpp 
-rwxr-xr-x. 1 root root 8552 11Ħ 11 21:48 testNoDebugInfo 


可 以 看 到 ， 程 序 test 的 大 小 有 9624 字 节 ， 而 testNoDebuglInfo 的 大 小 为 8552 字 节 ， 足 足 大 了 
一 千 多 字 节 。 
9. 选项 -pg 
选项 -pg 能 产生 供 gprof 剖析 用 的 可 执行 文件 。gprof 是 Linux 下 对 C++ 程序 进行 性 能 分 析 的 工 
He Jet E UE BLUR s 
既然 在 可 执行 文件 中 加 入 了 性 能 分 析 所 需 的 信息 ， 那 么 可 执行 程序 的 尺寸 肯定 变 大 了 ， 但 比 
加 了 -g 后 还 要 小 些 。 
【 例 2.17】 比 较 -g 和 -pg 生成 程序 的 大 小 
(1) 新 建 一 个 源 文件 test.cpp， 内 容 如 下 : 


#include <stdio.h> 


int main() 

{ 
bool b = false; 
printf("hello, boy Mn" ); 
return 0; 


} 

(2) 在 命令 行 下 带 上 -g 选项 后 编译 : 

[root@localhost test]# gcc test.cpp -g -o test 

在 命令 行 下 不 带 上 -pg 选项 后 编译 : 

[root@localhost test]# gcc test.cpp -o testWithPgInfo 


再 在 命令 行 下 不 带 上 -g 和 -pg 选项 后 编译 : 
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[root@localhost test]# gcc test.cpp -o testNoDebugInfo 
分 别 生 成 了 可 执行 文件 test 和 testNoDebugInfo， 然 后 用 Is -1 来 查看 它们 的 大 小 : 


-rwxr-xr-x. 1 root root 9624 11 月 11 21:47 test 
-rwxr-xr-x. 1 root root 8552 11) 11 21:48 testNoDebugInfo 
-rwxr-xr-x. 1 root root 8761 11H 11 22:03 testWithPgInfo 


可 以 看 到 ， 加 了 -g 生成 的 程序 test 尺寸 比 testWithPgInfo 大 。 

10. 选项 -| 

选项 -1 可 以 用 来 链接 共享 库 (动态 链接 库 ) 。 关 于 共享 库 后 面 会 讲 到 。 这 里 只 要 理解 它 是 可 执 
行程 序 运 行 时 需要 用 到 的 一 个 函数 库 , 可 执行 程序 调用 的 函数 是 在 这 个 库 里 实现 的 , 因此 需要 链接 
它 。-! 的 用 法 是 后 面 直接 加 动态 库 的 名 字 ， 比 如 编译 一 个 使 用 了 C++ 标准 库 里 内 容 的 程序 ， 则 需要 
链接 C++ 标准 库 ，gce 写成 : 





gcc test.cpp -1stdc++ -o test 
其 中 ，stdc++ 是 C++ 标准 库 的 名 字 ， 它 和 1 之 间 没 空格 。 选 项 -1 在 这 里 只 需 简单 了 解 ， 在 后 面 
章节 介绍 动态 库 的 时 候 ， 还 会 和 它 深入 打交道 。 


29 g++ 的 基本 使 用 


g++ 是 GNU 组 织 推出 的 C++ 编译 器 。 它 不 但 可 以 用 来 编译 传统 的 C++ 程序 ， 也 可 以 用 来 编译 
现代 C++， 比 如 C++1L14 等 。 
g++ 的 用 法 和 gec 类 似 ， 学 会 gcc 后 ， 相 信 g++ 也 能 很 快 上 手 。 而 且 ， 编 译 C++ 的 时 候 比 gee 
更 简单 ， 因 为 它 会 自动 链接 到 C++ 标准 库 ， 而 不 像 gcc 需要 手工 指定 。 
g++ 编译 程序 的 内 部 过 程 和 gec 一 样 ， 也 要 经 过 4 个 阶段 : 预 处 理 、 编 译 、 汇 编 和 链接 。g++ 
的 基本 语法 格式 如 下 : 
g++ [选项 ] 准备 编译 的 文件 【选项 ] [目标 文件 ] 
选项 和 gcc 的 选项 类 似 ， 这 里 不 再 效 述 。 
【 例 2.18】 用 g++ 编译 一 个 C++ 程 序 
CD 新 建 一 个 C++ 源 文件 test.cpp， 内 容 如 下 : 








#include <stdio.h> 


int main() 

t 
bool b - false; 
printf("hello, boy Mn" ); 
return 0; 
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(2) 在 命令 行 下 进入 test.cpp 所 在 目录 ， 然 后 用 g++ 进行 编译 : 
[root@localhost test]# g++ test.cpp -o test 
然后 运行 test: 


[root@localhost test]# ./test 
hello, boy 


可 以 发 现 ， 用 g++ 编译 C++ 程序 不 用 和 gec 那样 手工 去 链接 stdc++， 所 以 用 g++ 编译 C++ 程序 
更 加 方便 。 


【 例 2.19】 用 g++ 编译 多 个 C++ 程序 
CD 新 建 一 个 头 文件 speaker.h， 内 容 如 下 : 


class speaker 
t 
public: 
void sayHello(const char *); 


我 们 定义 了 一 个 类 speaker， 再 新 建 一 个 C++ 源 文件 speaker.cpp， 内 容 如 下 : 


#include "speaker.h" 
#include <iostream> 
using namespace std; 
void speaker: :sayHello (const char *str) 
t 
cout «« "Hello " «« str «« "An"; 


} 
我 们 实现 了 speaker 的 成 员 函 数 sayHello。 


(2) 新 建 一 个 C++ 源 文件 testspeaker.cpp， 内 容 如 下 : 


#include "speaker.h" 

int main(int argc,char *argv[]) 

t 
speaker speak; // 定 义 对 象 speak 
speak.sayHello("world"); // 调 用 成 员 函 数 sayHello 
return 0; 


H 
(3) 在 命令 行 下 进入 test.cpp 所 在 目录 ， 然 后 用 g++ 进行 编译 并 运行 : 
[root@localhost test]# g++ testspeaker.cpp speaker.cpp -o testspeaker 


[rootGlocalhost test]# ./testspeaker 
Hello world 
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2.10 gdb 调试 器 的 使 用 


2.10.1 为 何 要 学 习 gdb 调试 器 


前 面 介绍 了 编译 工具 gcce， 现 在 介绍 另 一 种 编程 重 器 一 一 gdb 调试 器 。 大 家 知道 ， 开 发 程序 难 
免 出 现 错误 ， 这 个 时 候 排除 错误 就 需要 一 定 的 方法 ， 动 态 调试 是 诸多 排 错 〈debug) 方法 中 最 有 效 、 
最 直观 的 一 个 。 所 以 掌握 调试 方法 是 开发 程序 ， 尤 其 是 大 型 程序 的 必 备 技能 。 在 Linux 下 ， 动 态 调 
试 程序 的 工具 是 gdb， 运 行 于 命令 行 下 。 不 过 也 有 版 本 可 以 使 用 于 图 形 界面 上 ， 但 Linux 很 多 时 候 
是 没有 图 形 界面 的 ， 因 此 掌握 命令 行 下 的 调试 方法 还 是 有 必要 的 。 更 何况 ,以 后 大 家 调试 一 些 内 核 
源 代码 或 内 核 模块 程序 的 时 候 ， 还 是 会 用 到 gdb 的 。 现 在 必须 学 好 gdb 来 调试 应 用 程序 。 


2.10.2 gdb 简介 


gdb 是 一 个 由 GNU 开源 组 织 发 布 的 、UNIX/Linux 操作 系统 下 的 、 基 于 命令 行 的、 功能 强大 的 
程序 调试 工具 。 虽 然 它 不 像 Windows 诸多 开发 环境 中 的 图 形 界面 调试 工具 ， 但 在 Linux FFR 
序 时 ， 你 会 发 现 gdb 调试 工具 十 分 强大 ， 更 适合 字符 界面 环境 ， 毕 况 Linux 系统 很 多 都 是 字符 界面 
系统 。 所 谓 “ 寸 有 所 长 ， 尺 有 所 短 ” 就 是 这 个 道理 。 一 般 来 说 ，gdb 主要 有 下 面 4 个 方面 的 功能 : 

(1) 启动 你 的 程序 ， 可 以 按照 自 定义 的 要 求 随心 所 欲 地 运行 程序 。 

(2) 可 让 被 调试 的 程序 在 你 所 指定 的 调试 的 断 点 处 停 住 ( 断 点 可 以 是 条 件 表达 式 ) 。 

G) 当 程 序 被 停 住 时 ， 可 以 检查 此 时 你 的 程序 中 所 发 生 的 事 ， 比 如 查看 某 个 变量 值 、 查 看 内 
存 堆 栈 内 容 等 。 

(4) 动态 改变 你 的 程序 的 执行 环境 。 

从 前 面 介 绍 的 功能 来 看 ，gdb 和 一 般 的 调试 工具 没有 什么 两 样 ， 基 本 上 也 是 完成 这 些 功能 ， 不 
过 在 细节 上 ， 你 会 发 现 gdb 调试 工具 的 强大 。 大 家 可 能 比较 习惯 图 形 化 的 调试 工具 , 但 有 时 候 命令 
行 的 调试 工具 却 有 着 图 形 化 工具 所 不 能 完成 的 功能 。 总 之 ，gdb 调试 器 能 让 我 们 观察 一 个 程序 在 执 
行 时 的 内 部 活动 ， 或 者 程序 出 错时 发 生 了 什么 。 
2.10.3 ”重要 准备 

要 使 用 gdb 来 调试 C/C++ 程序 ， 最 重要 的 准备 是 在 编译 C/C++ 程 序 的 时 候 ， 把 调试 信息 加 到 
可 执行 文件 中 。 前 面 讲 gee 的 时 候 ， 说 到 为 gcc 加 上 -g 选项 就 可 以 做 到 这 一 点 ， 比 如 : 

gcc -g test.c -o test 

如 果 没 有 -g， 我 们 将 看 不 见 程序 的 函数 名 、 变 量 名 ， 所 代替 的 全 是 运行 时 的 内 存 地址 。 切 记 ， 
如 果 要 用 gdb 调试 程序 ， 就 要 在 编译 时 使 用 -g。 
2.10.4 启动 gdb 

启动 gdb 很 简单 ， 就 是 在 命令 行 下 输入 gdb， 然 后 按 回 车 键 ， 如 果 成 功 ， 将 出 现 版 本 信息 ， 然 
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后 处 于 一 个 〈gdb) 状态 ， 在 此 状态 下 可 以 输入 所 需要 的 调试 命令 。 命 令 如 下 : 


[root@localhost test]# gdb 

GNU gdb (GDB) Red Hat Enterprise Linux 7.6.1-80.e17 

Copyright (C) 2013 Free Software Foundation, Inc. 

License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html> 
This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 
and "show warranty" for details. 

This GDB was configured as "x86 64-redhat-linux-gnu". 

For bug reporting instructions, please see: 
«http://www.gnu.org/software/gdb/bugs/». 

(gdb) 


在 这 种 状态 下 可 以 输入 gdb 命令 ，gdb 命令 较 多 ， 但 常用 的 大 概 有 10 个 左右 。 

也 可 以 在 启动 gdb 的 同时 加 载 一 个 要 调试 的 可 执行 文件 ， 比 如 : 

[root@localhost test]# gdb test 

GNU gdb (GDB) Red Hat Enterprise Linux 7.6.1-80.e17 

Copyright (C) 2013 Free Software Foundation, Inc. 

License GPLv3*: GNU GPL version 3 or later «http: //gnu.org/licenses/gpl.html» 
This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 
and "show warranty" for details. 

This GDB was configured as "x86 64-redhat-linux-gnu". 

For bug reporting instructions, please see: 
Xhttp://www.gnu.org/software/gdb/bugs/»... 

Reading symbols from /zww/test/test...(no debugging symbols found)...done. 
(gdb) 

由 于 这 个 test 在 编译 的 时 候 没有 加 选项 -g， 因 此 gdb 提示 : (no debugging symbols found) 

上 面 两 种 启动 方式 是 比较 常用 的 ， 除 此 之 外 ，gdb 还 可 以 按照 以 下 两 种 方式 启动 : 


(1) gdb <program> core 


用 gdb 同时 调试 一 个 运行 程序 和 core 文件 ，core 是 程序 非法 执行 core dump 后 产生 的 文件 。 


(2) gdb <program> <PID> 
如 果 我 们 的 程序 是 一 个 服务 程序 (守护 程序 ) ， 那 么 可 以 指定 这 个 服务 程序 运行 时 的 进程 ID。 
gdb 会 自动 attach 上 去 ， 并 调试 它 。program 应 该 在 PATH 环境 变量 中 搜索 得 到 。 
这 两 种 方式 用 得 不 多 ， 但 在 某 些 特殊 情况 下 也 会 用 到 。 
2.10.5 退出 gdb 
在 gdb 状态 下 ， 输 入 命令 quit 就 可 以 退出 gdb 调试 状态 ， 比 如 : 


(gdb) quit 
[rootélocalhost test]# 
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2.10.6 gdb 的 常用 命令 概述 


gdb 调试 工具 是 在 命令 行 下 使 用 的 , 自然 提供 了 不 少 命令 ,这 些 命令 都 是 在 gdb 启动 后 ,在 (gdb) 
提示 符 下 使 用 的 ， 常 见 的 命令 如 表 2-4 所 示 。 


表 2-4 gdb 的 常用 命令 
装 入 想 要 调试 的 可 执行 文件 
lis 列 出 产生 执行 文件 的 源 代码 的 一 部 分 
next 执行 一 行 源 代码 但 不 进入 函数 内 部 
step 执行 一 行 源 代 码 而 且 进 入 函数 内 部 
执行 当前 被 调试 的 程序 
继续 运行 程序 
mw | 
使 你 能 监视 一 个 变量 的 值 而 不 管 它 何 时 被 改变 
backtrace 栈 跟 踪 ， 查 出 代码 被 谁 调用 
使 你 能 不 退出 gdb 
使 你 能 不 离开 gdb 
whatis 显示 变量 或 函数 类 型 
break 在 代码 里 设 断 点 ， 这 将 使 程序 执行 到 这 里 时 被 挂 起 
info break 显示 当前 断 点 清单 ， 包 括 到 达 断 点 处 的 次 数 等 
info files 显示 被 调试 文件 的 详细 信息 
info func 显示 所 有 的 函数 名 称 
info local 显示 当前 函数 中 的 局 部 变量 信息 
info prog 显示 被 调试 程序 的 执行 状态 
aste] 


enable[n] 开启 第 nm 个 断 点 








ptype 显示 结构 定义 

set variable 
call name(args) 调用 并 执行 名 为 name、 参 数 为 args 的 函数 

finish 终止 当前 函数 并 输出 返回 值 

return value 停止 当前 函数 并 返回 value 给 调用 者 





不 需要 全 部 去 记忆 , 实践 中 经 常用 的 话 自然 会 记 住 。 具体 使 用 的 时 候 , 可 以 用 gdb 的 帮助 来 详 
细 了 解 某 个 命令 ， 在 gdb 提示 符 下 输入 help <command> 来 查看 某 个 命令 的 帮助 ， 比 如 “help 
breakpoints”， 查 看 设置 断 点 的 所 有 命令 。 
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2.10.7 file 命令 加 载 程序 
file 命令 用 来 加 载 要 调试 的 可 执行 程序 文件 ， 使 用 格式 如 下 : 
file [可 执行 程序 文件 ] 
因为 一 般 都 在 被 调试 程序 所 在 目录 下 执行 gdb， 所 以 文件 名 不 需要 带路 径 。 若 “[ 可 执行 程序 
文件 ”没有 加 路 径 ， 则 gdb 在 gdb 启动 时 所 在 的 目录 下 找 可 执行 程序 。 若 file 后 输入 一 个 当前 目 
录 下 没有 的 程序 名 ， 则 报错 。 
【 例 2.20】 加 载 要 调试 的 可 执行 文件 
CD 新 建 一 个 C++ 源 文件 test.cpp， 内 容 如 下 : 





#include <iostream> 

using namespace std; 

int main() 

t 
cout«« "hello, boy Wn"; 
return 0; 


) 
(2) 在 命令 行 下 进入 test.cpp 所 在 目录 ， 用 g++ 带 上 -g 后 编译 ， 然 后 运行 : 


[root@localhost test]# g++ -g test.cpp -o test 
[rootélocalhost test]# ./test 
hello, boy 


G) 启动 gdb， 然 后 加 载 可 执行 程序 test. 


[root@localhost test]# gdb 

GNU gdb (GDB) Red Hat Enterprise Linux 7.6.1-80.e17 

Copyright (C) 2013 Free Software Foundation, Inc. 

License GPLv3*: GNU GPL version 3 or later «http: //gnu.org/licenses/gpl.html» 
This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 
and "show warranty" for details. 

This GDB was configured as "x86 64-redhat-linux-gnu". 

For bug reporting instructions, please see: 

«http: //www.gnu.org/software/gdb/bugs/». 

(gdb) file test 

Reading symbols from /zww/test/test...done. 

(gdb) 


提示 Reading symbols from /zww/test/test...done, 说明 gdb 成 功 读 取 了 可 执行 文件 test 中 的 调试 
信息 ， 已 经 准备 好 接受 用 户 具体 的 调试 命令 了 。 


2.10.8 list 命令 显示 源 代码 
list 命令 可 以 列 出 可 执行 文件 的 源 代 码 的 一 部 分 ， 简 写 为 1。 该 命令 既 可 以 不 带 参数 ， 也 可 以 
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带 1 个 或 2 个 参数 。 

1. list 命令 不 带 参数 的 用 法 

不 带 参数 的 时 候 ，1list 命令 将 显示 10 行 源 代码 。 第 一 次 从 源 代码 文件 首 行 开始 显示 ， 第 二 次 
从 上 一 次 显示 的 末 行 后 的 下 一 行 开 始 显示 ， 以 此 类 推 。 

【 例 2.21] list 不 带 参数 显示 源 代码 内 容 

(1) 用 vi 或 gedit 新 建 一 个 C++ 源 文 件 test.cpp， 内 容 如 下 : 





#include <iostream> 

using namespace std; 

int main() 

{ 
cout<< "1 line\n"; 
cout<< "2 line\n"; 
cout<< "3 line\n"; 
cout<< "4 line\n"; 
cout<< "5 line\n"; 
cout<< "6 line\n"; 
cout<< "7 line\n"; 
cout<< "8 line\n"; 
cout<< "9 line\n"; 
cout«« "10 line Wn"; 
return 0; 

H 


(20 在 命令 行 下 编译 test.cpp， 注 意 要 加 -g: 
[root@localhost test]# g++ test.cpp -g -o test 
如 果 没 错 ， 就 会 生成 可 执行 程序 test。 下 面 启动 gdb。 


(3) 启动 gdb， 即 在 命令 行 下 直接 输入 gdb， 然 后 用 file 命令 加 载 test。 也 可 以 直接 用 gdb test 
形式 启动 gdb， 同 时 加 载 test。 这 里 我 们 先 输入 gdb, RTE 〈gdb) 下 输入 file 命令 。 


(gdb) file test 
Reading symbols from /zww/test/test...done. 


(4) 输入 list 命令 或 直接 输入 1 来 显示 源 代码 。 


(gdb) 1 

1 #include <iostream> 

2 using namespace std; 

3 int main() 

4 t 

5 cout«« "1 lineWn"; 
6 cout«« "2 lineWn"; 
3j cout«« "3 lineWMn"; 
8 cout«« "4 line\n"; 
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9 
10 


显示 了 10 行 


cout«« "5 lineWMn"; 
cout«« "6 line\n"; 


。 如 果 要 继续 显示 下 面 的 内 容 ， 可 以 再 输入 1。 


"7 line\n"; 
"8 line\n"; 
"9 line\n"; 
"10 lineWn"; 


(gdb) 1 

11 cout«« 
12 cout<< 
13 cout<< 
14 cout<< 
a5 return 0; 
16 ) 

dU! 


此 时 ，test 源 代 码 全 部 显示 完毕 了 。 
2. list 显示 指定 行 前 后 的 源 代码 内 容 
list 命令 带 一 个 数字 参数 时 ,显示 的 范围 是 参数 所 表示 的 行 的 前 5 行 和 后 4 行 。 命 令 格式 如 下 : 


list n 


其 中 n 表示 行 。 比 如 ， 我 们 要 显示 源 代码 第 6 行 的 前 5 行 和 后 4 行 的 内 容 ， 可 以 这 样 输入 


(gdb)list 6 
【 例 2.22] list 带 一 个 数字 显示 源 代码 内 容 

(1) 我 们 使 用 上 例 生成 的 可 执行 文件 test 启动 gdb 并 加 载 test: 
[root@localhost test]# gdb test 


(2) 在 gdb 下 用 命令 list 来 显示 第 8 行 的 前 5 行 和 后 4 行 的 内 容 : 


cout<< "1 line\n"; 


(gdb) list 8 

3 int main() 

4 t 

B 

6 cout«« 
T cout«« 
8 cout«« 
9 Cout<< 
10 Cout<< 
11 cout«« 
12 cout«« 


up 
ug 
"4 
"5 
"6 
ET 
"g 


lineWn"; 
lineWn"; 
lineWn"; 
lineWn"; 
line\n"; 
line\n"; 
line\n"; 


可 以 看 到 ， 显 示 的 范围 正 是 第 8 行 的 前 5 行 到 后 5 行 。 
3. list 显示 始末 行 之 间 的 源 代码 内 容 


list 命令 带 2 个 参数 时 ， 这 2 个 参数 分 别 表 示 起 始 行 和 结束 行 ， 显 示 的 范围 就 是 第 
代表 的 行 到 第 二 个 参数 所 代表 的 行 。 命 令 格式 如 下 : 














个 参数 所 
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list nl,n2 
其 中 ，nl 表示 起 始 行 、n2 表示 结束 行 。 比 如 我 们 显示 源 代码 第 2 行 到 第 6 行 的 内 容 ， 可 以 这 
样 写 : 
Tist 2,6 
【 例 2.23] list t 2 个 参数 显示 源 代 码 内 容 
(1) 使 用 上 例 生成 的 可 执行 文件 test 启动 gdb 并 加 载 test: 
[rootélocalhost test]# gdb test 
(2) 在 gdb 下 用 命令 list 来 显示 从 第 8 行 到 第 10 行 的 源 代码 内 容 : 


(gdb) list 8,10 


8 cout«« "4 line\n"; 
9 cout«« "5 line\n"; 
10 cout«« "6 lineWn"; 


4. list 显示 某 函 数 附近 的 源 代码 内 容 
list 命令 可 以 带 一 个 源 代码 中 的 函数 名 作为 参数 ， 这 样 可 以 显示 该 函数 的 上 下 10 行内 容 。 命 
令 格式 如 下 : 
list funcname 
【 例 2.24] list 显示 某 函 数 附近 的 源 代码 内 容 
(1) 使 用 上 例 生成 的 可 执行 文件 test 启动 gdb 并 加 载 test: 
[root@localhost test]# gdb test 
(2) 在 gdb 下 用 命令 list 来 显示 函数 main 上 下 10 行 的 源 代码 内 容 : 


(gdb) list main 
#include <iostream> 
using namespace std; 
int main () 
t 
cout«« "1 lineWn"; 
cout«« "2 line\n"; 
cout«« "3 lineWn"; 
cout«« "4 lineWMn"; 
cout«« "5 lineWn"; 
0 cout«« "6 lineWn"; 
(gdb) 


2.10.9 run 命令 运行 程序 


使 用 run 命令 可 以 在 gdb 中 运行 调试 中 的 程序 。run 命令 可 以 跟 一 个 或 多 个 参数 ， 这 些 参数 可 
以 用 来 发 给 可 执行 程序 。run 的 命令 格式 如 下 : 


Pioowauwm 必 wmwN 
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(gdb)run argl arg2 .. 


其 中 ，argl 和 arg2 都 是 命令 带 的 参数 ， 参 数 之 间 用 空格 隔 开 ， 参 数 的 个 数 可 以 多 于 2 个 ， 所 
以 后 面 用 了 省 略 号 。run 命令 也 可 用 r 来 代 蔡 ， 所 以 命令 格式 又 可 写 为 : 


(gdb)r argl arg2 .. 
【 例 2.25】 传 参数 给 程序 并 运行 程序 
(1) 新 建 一 个 C++ 源 文件 test.cpp， 内 容 如 下 : 


#include <iostream> 
using namespace std; 
int main(int argc,char *argv[]l) 
t 
int i; 
if (argc==3) 
{ 
cout<<"argc="<<argc<<endl; 
for (i=0;i<argc; i++) 
cout<<"argv["<<i<<"]="<<argv[i]<<endl; 
) 
else cout««"usage:./test 4 strl str2 str3"««endl; 


return 0; 
) 
(2) 用 g++ 带 -g 进行 编译 。 在 命令 行 下 ， 进 入 testcpp 所 在 目录 ， 然 后 输入 g++ 编 译 命令 : 
[root(localhost test]# g++ test.cpp -g -o test 
此 时 会 在 同 目录 下 生成 可 执行 程序 test。 
G) 用 gdb 加 载 test。 在 命令 行 下 ， 进 入 test 所 在 目录 ， 然 后 输入 命令 : 
[root@localhost test]# gdb test 
此 时 将 进入 <gdb> 提示 符 下 ， 我 们 可 以 用 r 命令 使 之 运行 : 


(gdb) run boy girl 

Starting program: /zww/test/test boy girl 

argc=3 

argv[0]-/zww/test/test 

argv[1]-boy 

argv[2]-girl 

[Inferior 1 (process 24828) exited normally] 

Missing separate debuginfos, use: debuginfo-install glibc-2.17-105.e17.x86 64 
libgcc-4.8.5-11.e17.x86 64 libstdctt-4.8.5-11.e17.x86 64 


可 以 看 到 ， 程 序 输出 了 我 们 输入 的 参数 ， 运 行 十 分 正常 (normally) 。 暂 时 不 要 退出 gdb, F 
面 会 继续 使 用 这 个 例子 。 
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1. 显示 传 给 main 的 参数 
我 们 可 以 用 命令 show args 来 显示 传 给 main 函数 的 参数 ， 比 如 接着 上 面 的 程序 ,在 <gdb> 提 示 
符 下 输入 命令 show args: 


(gdb) show args 
Argument list to give program being debugged when it is started is "boy girl". 


可 以 看 到 末尾 的 "boy girl"， 这 是 我 们 传 给 main 的 参数 。 


2. 重新 设置 传 给 main 的 参数 
接着 上 例 ， 如 果 继 续 在 <gdb> 下 输入 run， 会 发 现 默认 传递 上 一 次 run 传递 给 main 的 参数 ， 比 
如 继续 输入 run 命令 : 


(gdb) run 

Starting program: /zww/test/test boy girl 

argc-3 

argv[0]-/zww/test/test 

argv[1]-boy 

argv[2]-girl 

[Inferior 1 (process 24848) exited normally] 

虽然 此 时 run 没 带 参数 ， 但 是 依然 会 把 上 次 的 参数 传 给 main。 如 果 要 改变 传 给 main 的 参数 ， 
就 可 以 使 用 命令 set args。 比 如 在 <gdb> 下 输入 : 


(gdb) set args dad mum 

(gdb) run 

Starting program: /zww/test/test dad mum 
argc-3 

argv[0]-/zww/test/test 

argv[1]-dad 

argv [2] -mum 

[Inferior 1 (process 24857) exited normally] 


首先 设置 了 新 参数 dad 和 mum， 然 后 运行 ， 就 可 以 看 到 程序 输出 了 我 们 新 传 入 的 参数 。 


2.10.10 break 命令 设置 断 点 
断 点 就 是 让 程序 执行 暂停 的 地 方 ， 此 时 可 以 查看 相关 的 变量 或 某 内 存 地 址 的 内 容 。 在 gdb 中 ， 

可 以 用 break 命令 来 设置 断 点 。break 命令 在 代码 中 设置 断 点 后 ， 将 使 程序 执行 到 这 里 时 被 挂 起 ， 
也 就 是 停 下 来 。 它 有 以 下 几 种 方式 : 

(1) 根据 行 号 设置 断 点 ， 比 如 : (gdb) break linenumber。 

(20 根据 函数 名 设置 断 点 ， 比 如 : (gdb) break funcname. 

(3) 执 行 非 当前 源 文 件 的 某 行 或 某 函 数 时 停止 执行 ,比如 : (gdb) break filename:linenum 或 (gdb) 
break filename:funcname. 


(4) 根据 条 件 停止 执行 程序 ， 比 如: (gdb) break linenum if expr 或 (gdb) break funcname if expre 
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A break 命令 可 以 简写 成 b. | 


1. 指定 在 源 代码 的 某 行 处 设置 断 点 
我 们 可 以 使 用 命令 break 加 行 号 的 形式 来 指定 在 源 代码 的 某 行 处 设置 断 点 。 命 令 格 式 如 下 : 
(gdb)break linenumber 


其 中 ，linenumber 为 源 代码 中 某 行 的 行 号 ， 也 可 以 简写 为 b linenumber。 比 如 我 们 要 在 源 代码 
的 第 5 行 设置 断 点 ， 可 以 输入 break 命令 : 




















(gdb)break 5 
或 简写 成 : 
(gdb)b 5 


有 人 可 能 会 问 ， 是 否 要 知道 每 行 代码 的 行 号 才 行 呢 ? 的 确 如 此 ， 此 时 可 以 用 前 面 介绍 过 的 list 
命令 。 首 先 用 list 命令 显示 源 程序 代码 ， 这 样 每 行 代码 的 行 号 都 显示 出 来 了 ， 再 用 break 命令 来 设 
置 断 点 。 


【 例 2.26】 在 源 代码 某 行 处 设置 断 点 
(1) 新 建 一 个 C++ 源 文件 testcpp， 内 容 如 下 : 


#include <iostream> 
using namespace std; 
void zww(int age) 
t 
int a, b, c; 
if (age » 60) //line 6 
cout << "I am oldWn"; 
else 
cout << "I am young |n"; 


int main() 


int a= 5, b= 6; 
zww(70); 


att; //line 16 
btt; 
加 na a D) 

cout << a << endl; 
else 

cout << b << endl; 
return 0; 
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(2) 用 g++ 带 -g 进行 编译 。 在 命令 行 下 ， 进 入 test.cpp 所 在 目录 ， 然 后 输入 g++ 编译 命令 : 

[root(localhost test]# g++ test.cpp -g -o test 

(3) 启动 gdb 调试 test: 

[root@localhost test]# gdb test 

然后 在 <gdb> 下 可 以 用 list 命令 查看 源 代码 , 这 样 就 知道 每 行 的 行 号 了 。 这 里 在 第 15 行 处 设置 
断 点 : 


(gdb) b 16 
Breakpoint 1 at 0x400913: file test.cpp, line 16. 


可 以 发 现 ， 提 示 在 第 06 行 处 设置 了 断 点 〈Breakpoint) 。 注 意 只 是 在 第 16 行 设 置 了 断 点 ， 并 
不 是 运行 到 16 行 就 停 在 这 里 ， 要 运行 run 命令 来 启动 程序 ， 才 会 在 这 个 断 点 处 停 下 。 





(4) 设置 断 点 后 ， 我 们 可 以 用 run 命令 来 运行 程序 ， 以 便 在 断 点 处 停 下 : 


(gdb) run 
Starting program: /zww/test/test 
I am old 


Breakpoint 1, main () at test.cpp:16 
warning: Source file is more recent than executable. 
16 a++; //line 16 


可 以 看 到 程序 执行 到 第 16 行 停 下 来 了 ， 并 且 前 面 有 打印 语句 的 地 方 也 打印 出 来 了 《比如 am 
old) ， 而 第 16 行 后 面 的 代码 因为 还 没 执行 到 ， 所 以 没有 输出 。 

2. 在 源 代 码 的 某 函 数 处 设置 断 点 

我 们 可 以 使 用 命令 break 加 函数 名 的 形式 来 指定 在 源 代码 的 某 函 数 处 设置 断 点 。 命 令 格 式 如 下 : 

(gdb)break funcname 


其 中 ，funcname 为 源 代码 中 某 个 函数 的 名 字 ， 也 可 以 简写 为 b funcname。 比 如 我 们 要 在 源 代 
码 的 函数 myfunc 处 设置 断 点 ， 可 以 输入 break 命令 : 


(gdb)break myfunc 
或 简写 成 : 
(gdb)b myfunc 


【 例 2.27】 在 源 代 码 的 某 函 数 处 设置 断 点 
(1) 在 上 例 代码 的 基础 上 ， 我 们 启动 gdb 调试 test: 


[root@localhost test]# gdb test 


然后 在 <gdb> 下 可 以 用 list 命令 查看 源 代码 ， 这 样 就 知道 源 代码 的 所 有 函数 名 了 。 这 里 我 们 在 
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函数 zww 处 设置 断 点 : 


(gdb) b zww 
Breakpoint 2 at 0x4008cb: file test.cpp, line 6. 


(2) 设置 断 点 后 ， 我 们 可 以 用 run 命令 来 运行 程序 ， 以 便 在 断 点 处 停 下 : 


(gdb) run 
Starting program: /zww/test/test 


Breakpoint 1, zww (age-70) at test.cpp:6 
6 if (age » 60) 


可 以 发 现 , 程序 在 第 6 行 处 暂停 下 来 了 , 而 这 一 行 是 zww 函数 的 第 一 条 语句 , 注意 “int abc; " 
并 不 是 语句 ， 所 以 不 会 停 在 这 一 行 ， 但 如 果 我 们 定义 的 同时 又 进行 了 赋值 ， 就 会 停 在 该 行 ， 比 如 改 
成 : 


int a,b,c=2; 


W b zww 后 再 运行 ， 就 会 停 在 这 一 行 (第 5 行 ) 了 。 


3.4 C++ 基础 知识 


3.1.1 C++ 程序 结构 

我 们 从 一 个 简单 的 程序 入 手 看 一 个 C++ 程序 的 组 成 结构 。 
【 例 3.1】 第 一 个 C++ 例子 

(1) 打开 UE， 输 入 代码 如 下 : 

// my first program in C++ 


#include <iostream> 
using namespace std; 


int main() { 
cout << "Hello World!\n"; 
return 0; 
} 
以 上 代码 是 多 数 初 学 者 学 会 写 的 第 一 个 程序 ， 它 的 运行 结果 是 在 屏幕 上 打出 “Hello World!” 
这 句 话 。 虽 然 它 可 能 是 C++ 可 以 写 出 的 最 简单 的 程序 之 一 ， 但 其 中 已 经 包含 每 一 个 C++ 程序 的 基 
本 组 成 结构 。 下 面 我 们 就 逐个 分 析 其 组 成 结构 的 每 一 部 分 : 
// my first Program in C++ 
这 是 注释 行 。 所 有 以 两 个 斜 线 符号 UD 开始 的 程序 行 都 被 认为 是 注释 行 ， 这 些 注释 行 是 程序 
员 写 在 程序 源 代 码 内 , 用 来 对 程序 做 简单 解释 或 描述 的 ， 对 程序 本 身 的 运行 不 会 产生 影响 。 在 本 例 
中 ， 这 行 注释 对 本 程序 是 什么 做 了 一 个 简要 的 描述 。 
# include < iostream» 
以 # 标 志 开始 的 句子 是 预 处 理 器 的 指示 语句 。 它 们 不 是 可 执行 代码 ， 只 是 对 编译 器 做 出 指示 。 
在 本 例 中 , # include <iostream> 告诉 编译 器 的 预 处 理 器 将 输入 输出 流 的 标准 头 文件 (iostream ) 包 


括 在 本 程序 中 。 这 个 头 文件 包括 C++ 中 定义 的 标准 输入 输出 程序 库 的 声明 。 此 处 它 被 包括 进来 是 
因为 在 本 程序 的 后 面 将 用 到 它 的 功能 。 
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using namespace std; 


C++ 标准 函数 库 的 所 有 元 素 都 被 声明 在 一 个 命名 空间 中 ， 这 就 是 std 命名 空间 。 因 此 ， 为 了 能 
够 访问 它 的 功能 , 我 们 用 这 条 语句 来 表达 将 使 用 标准 命名 空间 中 定义 的 元 素 。 这 条 语句 在 使 用 标准 
函数 库 的 C++ 程序 中 频繁 出 现 ， 本 教程 中 大 部 分 代码 例子 中 也 将 用 到 它 。 


int main() 


这 一 行为 主 函数 Cmain function) 的 起 始 声明 。 main function 是 所 有 C++ 程序 运行 的 起 始点 。 不 
管 它 是 在 代码 的 开头 、 结 尾 还 是 中 间 ， 此 函数 中 的 代码 总 是 在 程序 开始 运行 时 第 一 个 被 执行 的 。 并 
且 ， 由 于 同样 的 原因 ， 所 有 C++ 程序 都 必须 有 一 个 main function. 

main 后 面 跟 了 一 对 圆 括号 “0”, 表示 它 是 一 个 函数 。 C++ 中 所 有 函数 都 跟 有 一 对 圆 括 号 “()”， 
括号 中 可 以 输入 一 些 参 数 。 例 如 例子 中 显示 的 ， 主 函数 (main function) 的 内 容 紧 跟 在 它 的 声明 之 
后 ， 由 花 括 号 “{}” 括 起 来 。 


cout << "Hello World! Wn"; 


这 个 语句 在 本 程序 中 最 重要 。cout 是 C++ 中 的 标准 输出 流 〈 通 常 为 控制 台 ， 即 屏幕 )， 这 句 话 
把 一 串 字 符 串 〈 本 例 中 为 “Hello World!" ) 插入 输出 流 〈 控 制 台 输出 ) Po cout 的 声明 在 头 文 
件 iostream.h 中 ， 所 以 要 想 使 用 cout， 必 须 将 该 头 文件 包括 在 程序 开始 处 。 

注意 这 个 句子 以 分 号 “;” 结 尾 。 分 号 标示 了 一 个 语句 的 结束 ，C++ 的 每 一 个 语句 都 必须 以 分 
号 结尾 。C++ 程 序 员 常 犯 的 错误 之 一 就 是 忘记 在 语句 末尾 写 上 分 号 。 











return 0; 


返回 语句 〈returmn) 引起 主 函数 main(0) 执 行 结 束 ， 并 将 该 语句 后 面 所 跟 代 码 〈 在 本 例 中 为 00 
返回 。 这 是 在 程序 执行 没有 出 现任 何 错误 的 情况 下 最 常见 的 程序 结束 方式 。 在 后 面 的 例子 中 ， 你 会 
看 到 所 有 C++ 程序 都 以 类 似 的 语句 结束 。 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[rootelocalhost test]# g++ test.cpp -o test 

[rootélocalhost test]# ./test 

Hello World! 

你 可 能 注意 到 并 不 是 程序 中 的 所 有 行 都 会 被 执行 。 程 序 中 可 以 有 注释 行 〈 以 /开头 ) ， 有 编译 
器 、 预 处 理 器 的 指示 行 〈 以 # 开 头 ) ， 然 后 有 函数 的 声明 〈 本 例 中 的 main 函数 ) ， 最 后 是 程序 语句 
(例如 调用 cout <<》， 最 后 这 些 语句 行 全 部 被 括 在 主 函数 的 花 括号 “{}” 内 。 

本 例 中 程序 被 写 在 不 同 的 行 中 以 方便 阅读 。 其 实 这 并 不 是 必需 的 ， 例 如 以 下 程序 : 

int main () 

{ 

cout «« " Hello World "; 


return 0; 


} 
也 可 以 被 写成 : 
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int main () ( cout << " Hello World "; return 0; } 


以 上 两 段 程序 是 完全 相同 的 。 
在 C++ 中 ， 语 句 的 分 隔 是 以 分 号 “;” 为 分 隔 符 的 。 分 行 写 代码 只 是 为 了 更 方便 编程 人 员 阅读 。 
以 下 程序 包含 更 多 的 语句 : 


// my second program in C++ 
#include <iostream> 
using namespace std; 
int main () 
t 
cout «« "Hello World! "; 
cout << "I'm a C++ program"; 
return 0; 


) 

这 段 代码 将 在 控制 台 窗 口上 输出 : Hello World! I'm a C++ program。 在 这 个 例子 中 ， 我 们 在 两 
个 不 同 的 语句 中 调用 了 cout << 函数 两 次 。 再 一 次 说 明 分 行 写 程序 代码 只 是 为 了 我 们 阅读 方便 ， 因 
为 这 个 main 函数 也 可 以 被 写 为 以 下 形式 而 没有 任何 问题 ; 

int main () ( cout «« " Hello World! "; cout «« " I'm to C++ program "; return 
0; } 

为 方便 起 见 ， 我 们 也 可 以 把 代码 分 为 更 多 的 行 来 写 : 


int main () 

t 

cout «« 

"Hello World!"; 

cout 

«« "I'm a C++ program"; 
return 0; 

H 


运行 结果 将 和 上 面 的 例子 完全 一 样 。 
这 个 规则 对 预 处 理 器 指示 行 〈 以 # 号 开始 的 行 ) 并 不 适用 ， 因 为 它们 并 不 是 真正 的 语句 。 它 们 
由 预 处 理 器 读 取 并 和 忽略， 并 不 会 生成 任何 代码 。 因 此 ,它们 每 一 个 必须 单独 成 行 ， 末尾 不 需要 加 分 


[= 
HE 


EE 


3.1.2 注释 

注释 (comments〉 是 源 代码 的 一 部 分 ， 但 它们 会 被 编译 器 忽略 ， 不 会 生成 任何 执行 代码 。 使 
用 注释 的 目的 只 是 使 程序 员 可 以 在 源 程序 中 插入 一 些 说 明 、 解 释 性 的 内 容 。 

C++ 支持 两 种 插入 注释 的 方法 : 





// line comment 
/* block comment */ 


第 一 种 方法 为 行 注释 , 它 告诉 编译 器 忽略 从 /开始 至 本 行 结束 的 任何 内 容 。 第 二 种 为 块 注 释 CBE 
注释 ) ， 告 诉 编译 器 忽略 在 /* 符 号 和 */ 符 号 之 间 的 所 有 内 容 ， 可 能 包含 多 行内 容 。 
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在 下 面 的 程序 中 ， 我 们 插入 了 更 多 注释 。 


/* my second program in C++ 
with more comments */ 


#include <iostream.h> 
int main () 


t 

cout «« "Hello World! "; // says Hello World! 

cout «« "I'm a C++ program"; // says I'm a C++ program 
return 0; 


) 


如 果 你 在 源 程序 中 插入 了 注释 而 没有 用 /符号 或 # 和 所 符号 ， 编 译 器 会 把 它们 当成 C++ 的 语句 ， 
在 编译 时 就 会 出 现 一 个 或 多 个 错误 信息 。 


3.1.3 ”变量 和 数据 类 型 


你 可 能 觉得 这 个 “Hello World! ”程序 用 处 不 大 。 我 们 写 了 好 几 行 代码 ， 编 译 ， 然 后 执行 ， 
生成 的 程序 只 是 为 了 在 屏幕 上 看 到 一 句 话 。 的确 , 我 们 直接 在 屏幕 上 打出 这 句 话 会 更 快 。 但 是 编程 
并 不 仅 限于 在 屏幕 上 打出 文字 这 么 简单 。 为 了 能 够 进一步 写 出 可 以 执行 更 有 用 的 任务 的 程序 , 我 们 
需要 引入 变量 〈variable) 这 个 概念 。 

设想 这 样 一 个 例子 ， 要 求 在 脑子 里 记 住 数字 5， 再 记 住 数字 2。 你 已 经 存储 了 两 个 数值 在 记忆 
里 。 现 在 要 求 在 说 的 第 一 个 数值 上 加 1， 应 该 保留 6 CHI 5+1) 和 2 在 记忆 里 。 现 在 如 果 将 两 数 相 
减 ， 可 以 得 到 结果 4。 

这 些 你 在 脑子 里 做 的 事情 与 计算 机 用 两 个 变量 可 以 做 的 事情 非常 相似 。 同 样 的 处 理 过 程 用 C++ 
来 表示 可 以 写成 下 面 一 段 代码 : 





a = 
b= 2; 
à= atip 

result = a - b; 

很 明显 这 是 一 个 很 简单 的 例子 , 因为 我 们 只 用 了 两 个 很 小 的 整数 数值 。 但 是 你 的 计算 机 可 以 同 
时 存储 成 千 上 万 个 这 样 的 数值 ， 并 进行 复杂 的 数学 运算 。 

因此 ， 我 们 可 以 将 变量 定义 为 内 存 的 一 部 分 ， 用 以 存储 一 个 确定 的 值 。 

每 一 个 变量 需要 一 个 标识 ， 以 便 将 它 与 其 他 变量 相 区 别 。 例 如 ， 在 前 面 的 代码 中 ， 变 量 标识 
是 a、b 和 result。 我 们 可 以 给 变量 起 任何 名 字 ， 只 要 它们 是 有 效 的 标识 符 。 


3.1.4 标识 


有 效 标识 由 字母 letter) 、 数 字 (digits) 和 下 画 线 C) 组成。 标识 的 长 度 没有 限制 ， 但 是 有 
些 编译 器 只 取 前 32 个 字符 〈 剩 下 的 字符 会 被 忽略 ) 。 

空格 (spaces) 、 标 点 〈punctuation marks) 和 符号 (symbols) 都 不 可 以 出 现在 标识 中 ， 只 有 
字母 、 数 字 和 下 画 线 是 合法 的 ， 并 且 变 量 标识 必须 以 字母 开头 。 标 识 也 可 能 以 下 画 线 开头 ， 但 这 种 
标识 通常 是 保留 给 外 部 连接 用 的 。 标 识 不 可 以 以 数字 开头 。 
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必须 注意 的 另 一 条 规则 是 ， 当 你 给 变量 起 名 字 时 ， 不 可 以 和 C++ 语言 的 关键 字 或 你 所 使 用 的 
编译 器 的 特殊 关键 字 同名 ， 因 为 这 样 会 与 这 些 关键 字 产生 混淆 。 例 如 ， 以 下 列 出 标准 保留 关键 字 ， 
它们 不 允许 被 用 作 变 量 标识 名 称 : 

asm, auto, bool, break, case, catch, char, class, const, const cast, continue, 
default, delete, do, double, dynamic cast, else, enum, explicit, extern, false, 
float, for, friend, goto, if, inline, int, long, mutable, namespace, new, operator, 
Private, protected, public, register, reinterpret cast, return, short, signed, 
sizeof, static, static cast, struct, switch, template, this, throw, true, try, 
typedef, typeid, typename, union, unsigned, using, virtual, void, volatile, wchar t, 
while 

另外 ， 不 要 使 用 一 些 操作 符 的 蔡 代 表示 作为 变量 标识 ， 因 为 在 某 些 环境 中 ， 它 们 可 能 被 用 作 
保留 词 : 


and, and eq, bitand, bitor, compl, not, not eq, or, or eq, xor, xor eq 


你 的 编译 器 还 可 能 包含 一 些 特殊 保留 词 , 例如 许多 生成 16 位 码 的 编译 器 (比如 一 些 DOS 编译 
器 ) 把 far、huge 和 near 也 作为 关键 字 。 

值得 注意 的 是 ，C++ 语 言 是 “大 小 写 敏 感 ” (case sensitive) 的 ， 即 同样 的 名 字 ， 字 母 大 小 写 
不 同 代表 不 同 的 变量 标识 。 因 此 ,例如 变量 RESULT、 变 量 result 和 变量 Result 分 别 表示 3 个 不 同 
的 变量 标识 。 


3.1.5 ”基本 数据 类 型 

编程 时 ， 我 们 将 变量 存储 在 计算 机 的 内 存 中 ， 但 是 计算 机 要 知道 我 们 要 用 这 些 变量 存储 什么 
样 的 值 ， 因 为 一 个 简单 的 数值 、 一 个 字符 或 一 个 巨大 的 数值 在 内 存 中 所 占用 的 空间 是 不 一 样 的 。 

计算 机 的 内 存 是 以 字 节 (byte) 为 单位 组 织 的 。 一 个 字 节 是 我 们 在 C++ 中 能 够 操作 的 最 小 的 内 
存单 位 。 一 个 字 节 可 以 存储 相对 较 小 的 数据 : 一 个 单个 的 字符 或 一 个 小 整数 〈 通 常 为 一 个 0-255 
的 整数 ) 。 但 是 计算 机 可 以 同时 操作 处 理由 多 个 字 节 组 成 的 复杂 数据 类 型 ， 比 如 长 整数 Cong 
integers) 和 小 数 (decimals) 。 表 3-1 总 结 了 现 有 的 C++ 基本 数据 类 型 以 及 每 一 种 类 型 所 能 存储 的 
数据 范围 。 


表 3-1 C++ 基 本 数据 类 型 以 及 每 一 种 类 型 所 能 存储 的 数据 范围 

















char 1 字符 (character) 或 整数 (integer) ，| 有 符号 (signed) : -128~127 
8 位 (bits) 长 无 符号 (unsigned) : 0~255 

short int short) | 2 短 整数 ，16 位 长 有 符号 : -32768~32767 
无 符号 : 0~65535 

long int (long) | 4 长 整数 ，32 位 长 有 符号 : -2147483648~2147483647 
无 符号 : 0-4294967295 

int 4 整数 有 符号 : -2147483648-2147483647 
无 符号 : 0~4294967295 








*93* 
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( 续 表 ) 

名 称 
float 浮 点 数 floating point number) 3.4e+/-38 (7 个 数字 ，7 digits) 
double 双 精 度 浮 点 数 (double precision 1.7e+/-308 (15 digits) 

floating point number) 
long double 长 双 精 度 浮 点 数 Clong double 1.7e+/-308 (15 digits) 

precision floating point number ) 
bool 布尔 (Boolean) 值 。 只 能 是 真 (true) | true 2 false 

或 假 (false) 两 个 值 之 一 
wchar t 宽 字符 (wide character) 。 这 是 为 存 | 一 个 宽 字符 

储 两 字 节 (2 bytes 长 的 国际 字符 而 

设计 的 类 型 








字 节 数 一 列 和 范围 一 列 可 能 根据 程序 编译 和 运行 的 系统 不 同 而 有 所 不 同 。 这 里 列 出 的 数值 是 多 
数 32 位 系统 的 常用 数据 。 对 于 其 他 系统 ， 通 常 的 说 法 是 整 型 (int) 具有 根据 系统 结构 建议 的 自然 
长 度 〈 一 个 字 的 长 度 ) ， 而 4 种 整 型 数据 char. short, int. long 的 长 度 必 须 是 递增 的 ， 也 就 是 说 
按 顺 序 每 一 类 型 必须 大 于 等 于 其 前 面 一 个 类 型 的 长 度 。 同 样 的 规则 也 适用 于 浮 点 数 类 型 float、 
double 和 long double， 也 是 按 递增 顺 序 。 

除 以 上 列 出 的 基本 数据 类 型 外 ， 还 有 指针 (pointer) 和 void 参数 表示 类 型 ， 我 们 将 在 后 面 看 到 。 


3.1.6 变量 的 定义 和 C++11 中 的 auto 

在 C++ 中 ， 要 使 用 一 个 变量 必须 先 定义 〈 有 些 文献 也 会 说 声明 ， 但 为 了 和 extern. 声明 变量 相 
区 分 ， 我 更 愿意 用 定义 ) 该 变量 的 数据 类 型 。 定 义 一 个 新 变量 的 语法 是 写 出 数据 类 型 标识 符 〈 例 如 
int, short, float 等 ) ， 后 面 跟 一 个 有 效 的 变量 标识 名 称 ， 例 如 : 

int a; 

float mynumber; 

以 上 两 个 均 为 有 效 的 变量 声明 (variable declaration) 。 第 一 个 声明 一 个 标识 为 a 的 整 型 变量 
Gnt variable) ， 第 二 个 声明 一 个 标识 为 mynumber 的 浮 点 型 变量 (float variable) 。 声 明之 后 ， 我 
们 就 可 以 在 后 面 的 程序 中 使 用 变量 a 和 mynumber 了 。 

如 果 你 需要 声明 多 个 同一 类 型 的 变量 ， 可 以 将 它们 缩写 在 同一 行 声明 中 ， 在 标识 之 间 用 逗号 
(comma) 分 隔 ， 例 如 : 

int a, b, c; 

以 上 语句 同时 定义 了 a.b. c 三 个 整 型 变量 ， 与 下 面 写法 的 意义 完全 等 同 : 

int a; 


int b; 
int c; 
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整 型 数据 类 型 (char、short、long 和 int) 可 以 是 有 符号 的 (signed) 或 无 符号 的 〈unsigned) ， 
这 取决 于 我 们 需要 表示 的 数据 范围 。 有 符号 类 型 (signed) 可 以 表示 正 数 和 负数 ， 而 无 符号 类 型 
(unsigned) 只 能 表示 正 数 和 0。 在 定义 一 个 整 型 数据 变量 时 , 可 以 在 数据 类 型 前 面 加 关键 字 signed 
或 unsigned 来 声明 数据 的 符号 类 型 ， 例 如 : 


unsigned short NumberOfSons; 
signed int MyAccountBalance; 


如 果 我 们 没有 特别 写 出 signed 或 unsigned， 那 么 变量 默认 为 signed， 因 此 以 上 第 二 个 声明 也 
可 以 写成 : 


int MyAccountBalance; 


因为 以 上 两 种 表示 方式 的 意义 完全 一 样 ， 所 以 我 们 在 源 程序 中 通常 省 略 关 键 字 signed. 
唯一 的 例外 是 字符 型 (char) 变量 ， 这 种 变量 独立 存在 ， 与 signed char 和 unsigned char 型 均 
不 相同 。 
short 和 1long 可 以 被 单独 用 来 表示 整 型 基本 数据 类 型 ,short 相 当 于 short int, long 相 当 于 long ints 
也 就 是 说 short year; 和 short int year; 两 种 声明 是 等 价 的 。 

最 后 ,signed 和 unsigned 也 可 以 被 单独 用 来 表示 简单 类 型 ,意思 分 别 同 signed int 和 unsigned int, 
即 以 下 两 种 声明 互相 等 同 : 














unsigned MyBirthYear; 
unsigned int MyBirthYear; 


下 面 我 们 就 用 C++ 代码 来 解决 在 这 一 节 前 面 提 到 的 记忆 问题 ， 来 看 一 下 变量 定义 是 如 何在 程 
序 中 起 作用 的 。 

【 例 3.2】 操 作 变 量 

(1) 打开 UE， 输 入 代码 如 下 : 





// operating with variables 
#include <iostream> 
using namespace std; 


int main () 

{ 
// declaring variables: 
int a; Di 
int result; 


// process: 

a = S5; 

b = 2; 
a=a+1; 
resolt = a = pi 


// print out the result: 
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cout << result««endl; 


// terminate the program: 
return 0; 
) 
如 果 以 上 程序 中 的 变量 声明 部 分 有 你 不 熟悉 的 地 方 , 不 用 担心 , 在 后 面 的 章节 中 很 快 会 学 到 这 
些 内 容 。 


(20. 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

4 

上 面 讲 了 一 个 变量 使 用 之 前 必须 进行 显 式 类 型 的 定义 ， 比 如 通过 int a 告 诉 编译 器 a 是 个 整 型 
变量 。 现 在 ，C++11 支持 隐 式 类 型 定义 了 ， 即 不 指明 变量 的 具体 类 型 ， 而 让 编译 器 推导 出 变量 的 
类 型 ， 而 且 是 在 编译 阶段 进行 推导 的 。 是 不 是 很 “高 大 上 ”? Too young to simple， 其 实 这 个 功能 
CHA 3.0 开始 就 有 了 ， 也 就 是 C# 中 的 var 关键 字 ， 只 不 过 C++11 中 用 的 是 auto 关键 字 。 下 面 演示 
auto 的 常见 用 法 : 

auto a = 20; // 编 译 器 自动 推导 a 为 int 型 ，auto 被 认为 是 int 

static auto f-0.1; // 编 译 器 自动 推导 f 为 double 型 ，auto 被 认为 是 doulbe 

auto p = new auto(5);  // 编 译 器 自动 推导 p 为 int * 型 ，auto 被 认为 是 intx 


const auto *q-&a,k-8;  ”// 编 译 器 自动 推导 q 为 const int * 型 ，k 自 动 推导 为 const int 型 ， 
auto 被 认为 是 int 


下 面 的 用 法 是 错误 的 : 


auto t; // 编 译 器 无 法 推导 出 t 的 类 型 
auto int b; // 在 c++11 中 ，auto 不 再 表示 存储 类 型 的 指示 符 


需要 注意 以 下 几 点 : 


(1) 使 用 auto 定义 变量 时 ， 必 须 同时 进行 初始 化 ， 以 便 编译 器 能 推导 出 变量 的 类 型 。 

(2) auto. 其 实 不 是 一 个 实际 的 类 型 ， 充 其 量 相当 于 一 个 类 型 占 位 符 ， 先 占 着 位 置 ， 等 到 编译 
的 时 候 推 导出 实际 类 型 时 再 蔡 换 为 真正 的 类 型 。 编译 器 推导 出 实际 类 型 的 依据 是 初始 化 的 内 容 。 比 
如 上 面 auto 常见 用 法 的 第 一 、 第 二 条 语句 ，20 是 整 型 常量 ， 因 此 a 的 类 型 被 推导 为 整 型 ，0.1 是 浮 
点 数 ， 因 此 f 被 推导 为 double. 

COD 同时 定义 多 个 变量 时 ， 不 能 产生 二 义 性 ， 否 则 报错 。 比 如 上 面 q 初始 化 内 容 为 整 型 变量 
的 地 址 ， 因 此 q 被 推导 为 int*+，auto 被 认为 是 int 这 个 实际 类 型 ， 然 后 编译 器 再 推导 k 为 int 型 ， 先 
后 一 致 ， 没 问题 。 如 果 我 们 这 样 初始 化 k: “k=0.8;” 那 么 编译 器 就 认为 k 是 double 型 ， 即 修饰 k 
的 实际 类 型 应 该 是 double， 而 前 面 推导 出 auto 是 int， 就 发 生 矛 盾 了 ， 此 时 编译 器 将 报错 。 

(4) auto 不 能 用 于 函数 参数 。 


auto 不 是 全 新 的 关键 字 ， 在 旧 标准 〈C++98/03) 的 版 本 中 ， 它 就 存在 ， 只 不 过 是 被 忽略 的 角 
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色 。 在 旧 标 准 中 ， 它 是 一 个 存储 类 型 的 指示 符 〈storage-class-specifier) ， 作 用 是 修饰 一 个 局 部 变量 
“具有 自动 存储 期 ”， 即 到 了 函数 结束 的 时 候 ， 局 部 变量 就 自动 释放 了 。 然 而 ， 局 部 变量 默认 是 具 
有 自动 存储 期 的 ， 因 此 我 们 很 少 这 样 定义 局 部 变量 : 


auto int a; 
而 是 直接 写 : 
int a; 


因为 两 者 等 价 ， 所 以 auto 很 少 抛 头 露面 了 。 在 C++11 P, auto 被 赋予 了 新 的 使 命 ， 变 成 了 类 
型 指示 符 (type- specifier) ， 作 用 是 告诉 编译 器 要 对 它 定义 的 变量 进行 类 型 推导 。 下 面 我 们 再 看 一 
组 auto 推导 的 小 例子 来 加 深 理解 : 

int a = 10; 

auto *p-&a; //p 为 int* 类 型 ，auto 被 推导 为 int 

auto q-&a; //9 为 int* 类 型 ，auto 被 推导 为 int* 


auto &s-a; //s 是 个 引用 ， 即 intg，auto 被 推导 为 int 
auto tes; ”//t 为 int，auto 被 推导 为 int 


const auto b=a; //b 为 const int，auto 被 推导 为 int 

auto c-b;  ”//b 为 nt，auto 被 推导 为 int 

volatile auto bl=a; //bl 为 volatile int，auto 被 推导 为 int 
auto cl-b; //cl 为 int，auto 被 推导 为 int 


const auto &d-a; //d 为 const int &，auto 被 推导 为 int 

auto &e-d; //e 为 const int &，auto 被 推导 为 int 

const volatile &dl-a;  //diJjvolatile int &，auto 被 推导 为 int 

auto &el-d; //el 为 volatile int &，auto 被 推导 为 int 

以 后 面 两 段 可 以 看 到 ， 当 const int 型 变量 用 于 初始 化 一 个 变量 Ce) Bf, auto 会 舍弃 const, AE 
为 int，volatile 也 是 如 此 ; 而 const int & 型 变量 用 于 初始 化 一 个 引用 变量 Ce) 时 ，const 将 被 保留 ， 
volatile 也 是 如 此 。 

上 面 只 是 一 些 简单 类 型 的 推导 ， 有 人 感觉 用 不 用 auto 其 实 区 别 不 大 。 下 面 我 们 看 auto 对 于 容 
器 迭代 器 〈iterator) 类 型 的 推导 ， 就 可 以 发 现 auto 的 可 贵 之 处 了 。 关 于 容器 是 C++ STL 里 的 内 容 ， 
大 家 可 以 参考 相关 书籍 。 这 里 主要 说 明 auto 的 作用 ， 不 对 容器 进行 展开 。 

std: :map<double, double> mymap; 

auto it=mymap.begin (); 

让 被 自动 推导 为 std::map<double,double>::iterator, 是 不 是 少 写 了 很 多 字符 ? 以 前 必须 全 部 
写 完 整 : 


Std::map«double,double»::iterator it-mymap.begin(); 


否则 编译 出 错 ， 现 在 有 了 auto， 大 大 减少 了 代码 量 ， 提 高 了 效率 。 
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3.1.7 ”变量 的 范围 


所 有 要 使 用 的 变量 都 必须 事先 声明 过 。C 和 C++ 语言 的 一 个 重要 区 别 是 ， 在 C++ 语言 中 ， 我 
们 可 以 在 源 程序 中 的 任何 地 方 声明 变量 ， 甚 至 可 以 在 两 个 可 执行 executable) 语句 的 中 间 声 明 变 
量 ， 而 不 像 在 C 语言 中 ， 变 量 声明 只 能 在 程序 的 开头 部 分 。 

然而 ， 还 是 建议 在 一 定 程度 上 遵循 C 语言 的 习惯 来 声明 变量 ， 因 为 将 变量 声明 放 在 一 处 对 调 
试 程序 有 好 处 。 传 统 的 C 语言 方式 的 变量 声明 就 是 把 变量 声明 放 在 每 一 个 函数 unction) 的 开头 
〈 对 本 地 变量 ) 或 直接 放 在 程序 开头 所 有 函数 (function) 的 外 面 〈 对 全 局 变量 ) 。 

一 个 变量 在 本 地 〈local) 范围 内 有 效 ， 叫 作 本 地 变量 ， 在 全 局 (globa) 范围 内 有 效 ， 叫 作 全 
局 变量 。 全 局 变量 要 定义 在 一 个 源码 文件 的 主体 中 ， 所 有 函数 〈 包 括 主 函 数 main()) 之 外 。 而 本 地 
变量 定义 在 一 个 函数 中 ， 甚 至 只 是 一 个 语句 块 单元 中 ， 如 图 3-1 所 示 。 


#include <iostream.h> 


cout << "Enter your age:" 
cin >> Age; 





图 3-1 


全 局 变量 (global variables) 可 以 在 程序 中 任何 地 方 的 任何 函数 中 被 引用 ， 只 要 是 在 变量 的 声 
明之 后 。 

本 地 变量 (local variables) 的 作用 范围 被 局 限 在 声明 它 的 程序 范围 内 。 如 果 本 地 变量 是 在 一 个 
函数 的 开头 被 声明 的 (例如 main 函数 )， 其 作用 范围 就 是 整个 main 函数 。 在 图 3-1 左边 的 例子 中 ， 
意味 着 如 果 在 main 函数 外 还 有 另 一 个 函数 ，main 函数 中 声明 的 本 地 变量 (Age, ANumber、 
AnotherOne) 不 能 够 被 另 一 个 函数 使 用 ， 反 之 亦 然 。 

在 C++ 中 , 本 地 变量 的 作用 范围 被 定义 在 声明 它 的 程序 块 内 (一 个 程序 块 是 被 一 对 花 插 号 “{}” 
括 起 来 的 一 组 语句 ) 。 如 果 变 量 是 在 一 个 函数 中 被 声明 的 ， 那 么 它 是 一 个 函数 范围 内 的 变量 ， 如 果 
变量 是 在 一 个 循环 中 (loop) 中 被 声明 的 ， 那 么 它 的 作用 范围 只 是 在 这 个 循环 中 ， 以 此 类 推 。 

除 本 地 和 全 局 范围 外 ， 还 有 一 种 外 部 范围 ， 它 使 得 一 个 变量 不 仅 在 同一 源 程序 文件 中 可 见 ， 
而 且 在 其 他 所 有 将 被 链接 在 一 起 的 源 文 件 中 均 可 见 。 


3.1.8 变量 初始 化 


当 一 个 本 地 变量 被 声明 时 ， 它 的 值 默认 为 未 定 Cundetermined) 。 但 你 可 能 希望 在 声明 变量 的 
同时 赋 给 它 一 个 具体 的 值 。 要 想 达到 这 个 目的 ， 需要 对 变量 进行 初始 化 。C++ 中 有 两 种 初始 化 方法 。 
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第 一 种 叫 作 类 C CC-Like) 方法 ， 是 在 声明 变量 的 时 候 加 上 一 个 等 于 号 ， 并 在 后 面 跟 上 想 要 的 
数值 : 


type identifier = initial value ; 
例如 ， 如 果 想 声明 一 个 叫 作 a 的 int 变量 并 同时 赋予 它 0 值 ， 可 以 这 样 写 : 
int a = 0; 


另 一 种 变量 初始 化 的 方法 叫 作 构造 函数 〈constructor) 初始 化 ， 是 将 初始 值 用 小 括号 “0” 括 


type identifier (initial value) ; 
例如 : 

int a (0); 

在 C++ 中 ， 以 上 两 种 方法 都 正确 并 且 两 者 等 同 。 
【 例 3.3】 变 量 的 初始 化 

(1) 打开 UE， 输 入 代码 如 下 : 

// 变量 初始 化 


#include <iostream> 
using namespace std; 


int main () 

t 
int a-5;  // 初始 值 为 5 
int b(2);  // 初始 值 为 2 
int result; // 不 确定 初始 值 


a t 3p 
result = a - b; 
cout << result<<endl; 


return 0; 


t 
(2) 保存 代码 为 tes.cpp, EEF] Linux， 在 命令 行 下 编译 运行 : 
[root@localhost test]# g++ test.cpp -o test 


[root@localhost test]# ./test 
6 


3.49 常量 


一 个 常量 (constant) 是 一 个 有 固定 值 的 表达 式 。 首 先 我 们 来 看 一 下 字 的 概念 ， 字 用 来 在 程序 
源 代码 中 表达 特定 的 值 。 在 前 面 的 内 容 中 ， 我 们 已 经 用 了 很 多 字 来 给 变量 赋予 特定 的 值 ， 例 如 : 
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a = 5; 


ERREP, 5 就 是 一 个 字 常 量 。 
字 常 量 (literal constant) 可 以 被 分 为 整数 、 浮 点 数 、 字 符 和 字符 串 。 


1. 整数 
整数 也 就 是 整 型 常数 ， 下 列 几 个 数字 就 是 整数 : 


1776 
707 
=273 


它们 是 整 型 常数 ， 表 示 十 进 制 整数 值 。 注 意 表 示 整 型 常数 时 ， 我 们 不 需要 写 引号 “"” 或 任何 
特殊 字符 。 毫 无 疑问 它 是 一 个 常量 : 任何 时 候 ， 当 我 们 在 程序 中 写 1776 时 ， 指 的 就 是 1776 这 个 数 
值 。 

除 十 进 制 整数 外 ，C++ 还 允许 使 用 八进制 (octal numbers) 和 十 六 进 制 (hexadecimal numbers ) 
的 字 常 量 。 如 果 我 们 想 要 表示 一 个 八进制 数 ， 就 必须 在 它 前 面 加 上 一 个 0 字符 (zero character? ， 
而 表示 十 六 进 制 数 则 需要 在 它 前 面 加 0x (zero、x) 字符 。 例 如 以 下 字 常 量 互 相等 值 : 

了 5 // 十 进 制 decimal 

0113 // 八进制 octal 

0x4b // 十 六 进 制 hexadecimal 

所 有 这 些 都 表示 同一 个 整数 : 75， 分 别 以 十 进 制 数 、 八 进 制 数 和 十 六 进 制 数 表 示 。 

像 变量 一 样 ， 常 量 也 是 有 数据 类 型 的 。 默 认 的 整数 字 常 量 的 类 型 为 int 型 。 我 们 可 以 通过 在 后 
面 加 字母 u 或 1 来 迫使 它 为 无 符号 Cunsigned). 的 类 型 或 长 整 型 (long) o 


75 M ADE 

75u // unsigned int 

FSE // long 

75ul // unsigned long 

ix Hi Jed u 和 1 可 以 是 大 写 的 ， 也 可 以 是 小 写 的 。 
2. 浮 点 数 


FERRADA (decimals) IKRA C exponents) 的 形式 表示 ， 可 以 包括 一 个 小 数 点 ， 一 个 e 
字符 (表示 by ten at the Xth height, iX! X 是 后 面 跟 的 整数 值 ) ， 或 两 者 都 包括 。 

3.14159 // 3.14159 

6.02e23 // 6.02X10^1023 

1.6e-19 // 1.6X10^-19 

3.0 E 

以 上 是 包含 小 数 的 以 C++ 表示 的 4 个 有 效 数 值 。 第 一 个 是 PI， 第 二 个 是 Avogadro 数 之 一 ， 第 
三 个 是 一 个 电子 (electron) 的 电量 (electric charge， 一 个 极 小 的 数值 ) ， 这 些 都 是 近似 值 。 最 后 
一 个 是 浮 点 数字 常量 ， 表 示 数 3 。 

浮 点 数 的 默认 数据 类 型 为 double。 如 果 你 想 使 用 float 或 long double 类 型 ， 可 以 在 后 面 加 ff 或 
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1 后 级 ， 同 样 大 小 写 都 可 以 : 


3.14159L  // long double 

6.02e23f  // float 

3. 字符 和 字符 串 

除了 数字 常量 外 ， 还 有 非 数字 常量 ， 例 如 : 
Usu 

"p! 

"Hello world" 

"How do you do?" 


前 两 个 表达 式 表示 单独 的 字符 , 后 面 两 个 表示 由 若干 字符 组 成 的 字符 串 。 注 意 ,在 表示 单独 字 
符 的 时 候 ， 我 们 用 单 引 号 “'”， 在 表示 字符 串 或 多 于 一 个 字符 的 时 候 ， 我 们 用 双 引 号 “"”。 

当 以 常量 方式 表示 单个 字符 和 字符 串 时 ， 必 须 写 上 引号 ， 以 便 把 它们 和 可 能 的 变量 标识 或 保 
留 字 区 分 开 ， 注 意 以 下 例子 : 


x 


x 指 一 个 变量 名 称 为 x, 而 'x' 指 字符 常量 'x'。 
字符 常量 和 字符 串 常量 各 有 特点 ， 例 如 escape codes， 这 些 是 除 此 之 外 无 法 在 源 程序 中 表示 的 


特殊 字符 ， 例 如 换行 符 (\n) 或 跳跃 符 〈\t) 。 这 些 符号 前 面 都 要 加 一 个 反 斜 枉 〈\) 。 这 里 列 出 了 


这 些 escape codes: 





\n 换行 符 newline 

Wr 回 车 carriage return 

Nt ”跳跃 符 tabulation 

\v 垂直 跳跃 vertical tabulation 
\b backspace 

Nf page feed 

Sa fialert (beep) 

V! 单 引 号 single quotes (') 
V" 双 引 号 double quotes (") 
\? 问号 question (?) 

\\ 反 斜 杠 inverted slash (V 


例如 : 


\n' 

"Ner 

"Left Nt Right" 

"oneMntwoMnthree" 

另外 ， 你 可 以 以 数字 ASCI 码 表示 一 个 字符 ， 这 种 表示 方式 是 在 反 斜 杠 〈\) 之 后 加 以 8 进 制 
数 或 十 六 进 制 数 表示 的 ASCI 码 。 在 第 一 种 (八进制 ) 表示 中 ， 数 字 必须 紧 跟 反 斜 枉 〈 例 如 \23 或 
V0) ， 在 第 二 种 〈 十 六 进 制 ) 表示 中 ， 必 须 在 数字 之 前 写 一 个 x 字符 〈 例 如 \x20 或 x4A) 。 
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如 果 每 一 行 代码 以 反 斜 枉 〈\) 结束， 字符 串 常 量 可 以 分 多 行 代码 表示 : 


"string expressed in V 
two lines" 


还 可 以 将 多 个 被 空格 Cblankspace) 、 跳 跃 符 Ctabulator) 、 换 行 符 (newline) 或 其 他 有 效 空 
白 符 号 分 隔 开 的 字符 串 常量 连接 在 一 起 : 

"we form" "a single" "string" "of characters" 

最 后 ， 如 果 想 让 字符 串 使 用 宽 字符 Cwchar O ， 而 不 是 窄 字符 Cchar) ， 可 以 在 常量 的 前 面 
Anzi L: 

L"This is a wide character string" 

宽 字 符 通常 用 来 存储 非 英语 字符 ， 比 如 中 文字 符 ， 一 个 字符 占 两 个 字 节 。 关 于 字符 串 后 面 还 会 
详细 讲述 。 

4. 布尔 型 常量 

布尔 型 只 有 两 个 有 效 的 值 : true 和 false， 其 数据 类 型 为 bool。 

5. 定义 常量 

使 用 预 处 理 器 指令 #define 可 以 将 那些 经 常 使 用 的 常量 定义 为 你 自己 取 的 名 字 而 不 需要 借助 于 
变量 。 它 的 格式 是 : 

#define identifier value 

例如 : 


#define PI 3.14159265 

#define NEWLINE '\n' 

#define WIDTH 100 

以 上 定义 了 3 个 常量 。 一 旦 做 了 这 些 声明 ， 你 可 以 在 后 面 的 程序 中 使 用 这 些 常量 ， 就 像 使 用 
其 他 任何 常量 一 样 ， 例 如 : 

circle = 2 * PT * r} 

cout << NEWLINE; 

实际 上 ， 编 译 器 在 遇 到 #define 指令 的 时 候 ， 做 的 只 是 把 任何 出 现 这 些 常量 名 (在 前 面 的 例子 
中 为 PI NEWLINE 或 WIDTH) 的 地 方 蔡 换 成 它们 被 定义 为 的 代码 分别 为 3.14159265、 "w' 
和 1000 。 因 此 ， 由 #define 定义 的 常量 被 称 为 宏 常量 (macro constants) o 

#define 指令 不 是 代码 语句 ， 它 是 预 处 理 器 指令 ， 因 此 指令 行 末尾 不 需要 加 分 号 (;) 。 如 果 你 
在 宏 定义 行 末尾 加 了 分 号 CO ， 当 预 处 理 器 在 程序 中 做 常量 蔡 换 的 时 候 ， 分 号 也 会 被 加 到 被 蔡 换 
的 行 中 ， 这 样 可 能 导致 错误 。 
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6. 声明 常量 
通过 使 用 const 前 绥 可 以 定义 指定 类 型 的 常量 ， 就 像 定义 一 个 变量 一 样 : 














const int width = 100; 
const char tab = 'Nt'; 
const zip = 12440; 


如 果 没 有 指定 类 型 〈 如 上 面 例子 中 的 最 后 一 行 ) ， 编 译 器 会 假设 常量 为 整 型 。 


3.1.10 ”操作 符 /运算 符 

前 面 已 经 学 习 了 变量 和 常量 ， 我 们 可 以 开始 对 它们 进行 操作 ， 这 就 要 用 到 C++ 的 操作 符 。 在 
有 些 语 言 中 ， 很 多 操作 符 都 是 一 些 关键 字 ， 比 如 add. equals 等 。C++ 的 操作 符 主 要 是 由 符号 组 成 
的 。 这 些 符 号 不 在 字母 表 中 ， 但 是 在 所 有 键盘 上 都 可 以 找到 。 这 个 特点 使 得 C++ 程序 更 简洁 ， 也 
更 国际 化 。 操 作 符 也 称 运 算 符 。 运 算 符 是 C++ 语言 的 基础 ， 非 常 重要 。 

1. 赋值 运算 符 

赋值 运算 符 的 功能 是 将 一 个 值 赋 给 一 个 变量 。 





a= 5; 

将 整数 5 赋 给 变量 a。= 运算 符 左边 的 部 分 叫 作 IvalueCleft value), 右边 的 部 分 叫 作 rvalue (right 
value) 。lvalue 必须 是 一 个 变量 ， 而 右边 的 部 分 可 以 是 一 个 常量 、 一 个 变量 、 一 个 运算 (operation ) 
的 结果 或 是 前 面 几 项 的 任意 组 合 。 

强调 一 下 ， 赋 值 运算 符 永远 是 将 右边 的 值 赋 给 左边 ， 不 会 反 过 来 。 

a = b; 

将 变量 b (value) 的 值 赋 给 变量 a (value) ， 不 论 a 当时 存储 的 是 什么 值 。 同 时 考虑 到 只 
是 将 b 的 数值 赋 给 a， 以 后 如 果 b 的 值 改变 了 ， 并 不 会 影响 到 a 的 值 。 

【 例 3.4】 赋 值 运算 符 的 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main () 
{ 


int a, b; VV EE sc 
a = 10; aln, De? 
b = 4; 7/7 2:10, b:4 
a-b; // a:4, DA 
b= 7; yard DT 


COUE << tar" 
cout << a<<endl; 
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cout << "bs" 
cout << b<<endl; 


return 0; 


} 
以 上 代码 的 结果 是 a 的 值 为 4，b 的 值 为 7。b=7 语句 导致 b 被 改变 ， 但 并 不 会 影响 到 a， 虽 然 
在 此 之 前 我 们 声明 了 a=b; 〈 从 右 到 左 规则 ) 。 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[rootelocalhost test]# g++ test.cpp -o test 
[rootQlocalhost test]# ./test 

a:4 

DET 


C++ 拥 有 而 其 他 语言 没有 的 一 个 特性 是 赋值 符 (=) 可 以 被 用 作 另 一 个 赋值 符 的 rvalue( 或 rvalue 
的 一 部 分 ) ， 例 如 : 


D AkO 


意思 是 : 先 将 5 赋 给 变量 b， 然 后 把 前 面 对 b 的 赋值 运算 的 结果 CHI 5) 加 上 2 再 赋 给 变量 a， 
这 样 最 后 a 中 的 值 为 7。 因 此 ， 下 面 的 表达 式 在 C++ 中 也 是 正确 的 : 
a=b=c= 5; // 将 5 同时 赋 给 3 个 变量 a、b 和 c 
2. 数学 运算 符 
C++ 语 言 支持 的 5 种 数学 运算 符 为 : 
CD + Oll, addition) 。 
(2) - QR, subtraction) . 
(3) * (E, multiplication) o 
(4) / (KR, division? . 
(5) % CW, module) 。 
加 减 乘 除 运算 想必 大 家 都 很 了 解 ， 它 们 和 一 般 的 数学 运算 符 没有 区 别 。 
唯一 你 可 能 不 太 熟 悉 的 是 用 百 分 号 (A) 表示 的 取 模 运算 (module) 。 取 模 运 算是 取 两 个 整数 
相 除 的 余数 。 例 如 ， 如 果 我 们 写 a= 11 % 3;， 变 量 a 的 值 将 会 为 2， 因 为 2 是 11 除 以 3 的 余数 。 


3. 组 合 运 算 符 
C++ 以 书写 简练 著称 的 一 大 特色 就 是 组 合 运算 符 (+=、 一 、 *= 和 三 及 其 他 ) ， 这 些 运算 
符 使 得 只 用 一 个 基本 运算 符 就 可 以 改写 变量 的 值 : 
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value += increase; 等 同 于 value = value + increase; 

a -= 5; 等 同 于 a =a- 5; 

a /= b; 等同 于 a = a / b; 

price *- units + 1; 等 同 于 price = price * (units + 1); 


其 他 运算 符 以 此 类 推 。 下 面 来 看 组 合 运算 符 的 例子 。 
【 例 3.5】 组 合 运算 符 的 使 用 

(1) 打开 UE， 输 入 代码 如 下 : 

// 组 合 运算 符 的 例子 


#include <iostream> 
using namespace std; 


int main () 


t 


a+=2; // 相当 于 a=a+2 
cout << a««endl; 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
5 


4. 递增 和 递减 

书写 简练 的 另 一 个 例子 是 递增 (increase〉 运算 符 (++) 和 递减 (decrease) 运算 符 C) 。 
它们 使 得 变量 中 存储 的 值 加 1 或 减 1， 分 别 等 同 于 +=1 和 -=1。 因 此 : 

att 

at-1; 

a-atl; 
在 功能 上 全 部 等 同 ， 即 全 部 使 得 变量 a 的 值 加 1。 

递增 运算 符 的 存在 是 因为 最 早 的 C 编译 器 将 以 上 3 种 表达 式 编译 成 不 同 的 机 器 代码 ， 不 同 的 
机 器 代码 运行 速度 不 一 样 。 现 在 ， 编 译 器 已 经 基本 自动 实行 代码 优化 , 所 以 以 上 3 种 不 同 的 表达 方 
式 编译 成 的 机 器 代码 在 实际 运行 上 已 基本 相同 。 

递增 运算 符 的 一 个 特点 是 既 可 以 被 用 作 前 缀 (prefix) ， 也 可 以 被 用 作 后 缀 (suffix) ， 也 就 是 
说 它 既 可 以 被 写 在 变量 标识 的 前 面 (++a) ， 也 可 以 被 写 在 后 面 (a++) 。 虽 然 在 简单 表达 式 〈 如 
at++ 或 ++a) 中 ， 这 两 种 写法 代表 同样 的 意思 ， 但 当 递 增 或 递减 的 运算 结果 被 直接 用 在 其 他 的 运算 
式 中 时 ， 它 们 就 代表 不 同 的 意思 了 : 当 递 增 运算 符 被 用 作 前 组 〈++ta) 时， 变量 a 的 值 先 增加 ， 再 
计算 整个 表达 式 的 值 ， 因 此 增加 后 的 值 被 用 在 了 表达 式 的 计算 中 ;， 当 它 被 用 作 后 级 (at+) 时 ， 变 
量 a 的 值 在 表达 式 计算 后 才 增加 ， 因 此 a 在 增加 前 所 存储 的 值 被 用 在 了 表达 式 的 计算 中 。 注 意 表 
3-2 中 两 个 例子 的 不 同 。 
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表 3-2 两 个 例子 
例 1 例 2 
B-3; B-3; 
A=++B; A=B++; 
JA 的 值 为 4，B 的 值 为 4 /1/A 的 值 为 3，B 的 值 为 4 








在 第 一 个 例子 中 ，B 在 它 的 值 被 赋 给 A 之 前 增加 1。 而 在 第 二 个 例子 中 ，B 原来 的 值 3 被 赋 给 
A， 然 后 B 的 值 才 加 1 变 为 4。 


5. 关系 运算 符 

我 们 用 关系 运算 符 来 比较 两 个 表达 式 。 例 如 ANSI-C++ 标准 中 指出 ， 关 系 运算 的 结果 是 一 个 
bool 值 ， 根 据 运算 结果 的 不 同 ， 它 的 值 只 能 是 true 或 false。 

例如 , 我 们 想 通 过 比较 两 个 表达 式 来 看 它们 是 否 相 等 或 一 个 值 是 否 比 另 一 个 值 大 。 以 下 为 C++ 
的 关系 运算 符 : 


== 相等 (Equal) 。 
!= PÆ (Different) 。 
大 于 CGreaterthan) 。 
小 于 (Less than) 。 
>= KTFF (Greater or equal than). 。 
<= 小 于 等 于 (Less or equal than) 。 


下 面 可 以 看 到 一 些 实际 的 例子 : 


(7 = 5) 将 返回 false; 
(5>4) 将 返回 true。 
(3 !=2) 将 返回 true。 
(6>= 6) 将 返回 true。 
(5<5) 将 返回 false。 


当然 ， 除 了 使 用 数字 常量 外 ， 我 们 也 可 以 使 用 任何 有 效 表达 式 ， 包 括 变量 。 假 设 有 a=2、 b=3 
和 c=6: 





(a == 5) 将 返回 false; 

(a*b >= c) 将 返回 tue， 因 为 它 实际 是 (2*3 >= 6)。 
(b+4 > a*c) 将 返回 false， 因 为 它 实 际 是 3+4 > 2*6). 
((b=2) = a) 将 返回 true. 


注意 : 运算 符 = (单个 等 号 ) 不 同 于 运算 符 一 〈 双 等 号 )。 第 一 个 (二) 是 赋值 运算 符 (将 等 
号 右边 的 表达 式 的 值 赋 给 左边 的 变量 ) ; 第 二 个 (二) 是 一 个 判断 等 于 的 关系 运算 符 ， 用 来 判断 
运算 符 两 边 的 表达 式 是 否 相等 。 因此 ,在 上 面 的 例子 中 ， 最 后 一 个 表达 式 ((b=2) == a). 我 们 首先 将 
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数值 2 赋 给 变量 b， 然 后 把 它 和 变量 a 进行 比较 。 因 为 变量 a 中 存储 的 也 是 数值 2， 所 以 整个 运算 
的 结果 为 true。 
在 ANSI-C++ 标 准 出 现 之 前 ， 许 多 编译 器 中 ， 就 像 C 语言 中 ， 关 系 运算 并 不 返回 值 为 true 或 
false 的 bool 值 ， 而 是 返回 一 个 整 型 数值 为 结果 ， 它 的 数值 可 以 为 0， 代 表 false, 或 一 个 非 0 数值 
(通常 为 1) ， 代 表 trues 


6. 逻辑 运算 符 

运算 符 ! 等 同 于 boolean 运算 NOT ( 取 非 ) ， 它 只 有 一 个 操作 数 〈operand) ， 写 在 它 的 右 
边 。 它 做 的 唯一 工作 就 是 取 该 操作 数 的 反面 值 ， 也 就 是 说 如 果 操 作 数 值 为 tue， 那 么 运算 后 值 变 为 
false， 如 果 操 作 数 值 为 false， 那 么 运算 结果 为 tue。 它 就 像 是 取 与 操作 数 相 反 的 值 ， 例 如 : 


!(5 — 5) 返回 false， 因 为 它 右边 的 表达 式 (5 = 5) 为 true。 
!(6 <=4) 返回 true， 因 为 (6 <= 4) 为 false. 

ltrue 返回 false。 

!false 返回 true。 


逻辑 运算 符 && 和 | 用 来 计算 两 个 表达 式 而 获得 一 个 结果 值 。 它 们 分 别 对 应 逻辑 运算 中 的 与 运算 
CAND) 和 或 运算 (OR) 。 它 们 的 运算 结果 取决 于 两 个 操作 数 (operand) 的 关系 ， 如 表 3-3 所 示 。 





表 3-3 ”两 个 操作 数 的 关系 





第 一 个 操作 数 a 第 二 个 操作 数 b a && b 的 结果 a || b 的 结果 





例如 : 

( (5 == 5) && (3 > 6) ) 返回 false ( true && false ) . 
(SD mS 返回 true ( true || false ). 
7. 条 件 运 算 符 


条 件 运 算 符 计算 一 个 表达 式 的 值 并 根据 表达 式 的 计算 结果 为 true 或 false 而 返回 不 同 的 值 。 它 
的 格式 是 : 


condition ? resultl : result2 (条 件 ? 返回 值 1: 返回 值 2) 
如 果 条 件 为 ttue， 整 个 表达 式 将 返回 resultl ， 否 则 将 返回 result2。 
7=--524:3 返回 3， 因 为 7 不 等 于 5。 

7==5+2?4:3 ”返回 4， 因 为 7 等 于 5+2。 


5>3?a:b 返回 a， 因 为 5 大 于 3。 
a>b?a:b 返回 较 大 值 ，a 或 b。 
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【 例 3.6】 条 件 运算 符 的 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main () 
int a,b,c; 
a-2; 
b-7; 
c = (a»b) ? a : b; 


cout << c««endl; 


return 0; 


) 
上 面 的 例子 中 , a 的 值 为 2, b 的 值 为 7, 所 以 表达 式 (a>b) 运算 值 为 false, 整个 表达 式 (a>b)?a:b 
要 取 分 号 后 面 的 值 ， 也 就 是 b 的 值 7。 因 此 ， 最 后 输出 c 的 值 为 7。 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 


8. 逗号 运算 符 

逗号 运算 符 〈，) 用 来 分 开 多 个 表达 式 ， 并 只 取 最 右边 的 表达 式 的 值 返回 。 

例如 以 下 代码 : 

a= (b=3, b+2); 

这 行 代码 首先 将 3 赋值 给 变量 b， 然 后 将 b+2 赋值 给 变量 a。 所 以 最 后 变量 a 的 值 为 5， 而 
变量 b 的 值 为 3。 

9. 位 运算 符 

位 运算 符 以 比特 位 改写 变量 存储 的 数值 ， 也 就 是 改写 变量 值 的 二 进 制 表示 : 

op asm Description 

& AND 逻辑 与 (Logic AND) 

| OR ZER (Logic OR) 

^  XOR 逻辑 异 或 (Logical exclusive OR) 

^ NOT 对 1 取 补 (位 反 转 ) (Complement to one (bit inversion) ) 


«« SHL 左 移 (Shift Left) 
>> SHR 右 移 (Shift Right) 


10. 变量 类 型 转换 运算 符 
变量 类 型 转换 运算 符 可 以 将 一 种 类 型 的 数据 转换 为 另 一 种 类 型 的 数据 。 在 C++ 中 ， 有 几 种 方 
法 可 以 实现 这 种 操作 ， 最 常用 的 一 种 ， 也 是 与 C 兼容 的 一 种 ， 是 在 原 转换 的 表达 式 前 面 加 用 括号 








C++ 语言 基础 # 3# 





“0” 括 起 的 新 数据 类 型 

int i; 

float f - 3.14; 

i = (int) f; 

以 上 代码 将 浮 点 型 数字 3.14 转换 成 一 个 整数 值 (3) 。 这 里 类 型 转换 操作 符 为 Gnt) o TE C++ 
中 ， 实 现 这 一 操作 的 另 一 种 方法 是 使 用 构造 函数 〈constructor) 的 形式 : 在 要 转换 的 表达 式 前 加 变 
量 类 型 并 将 表达 式 括 在 括号 中 : 

KE 

以 上 两 种 类 型 转换 的 方法 在 C++ 中 都 是 合法 的 。 另 外 ，ANSI-C++ 针 对 面向 对 象 编程 〈object 
oriented programming) 增加 了 新 的 类 型 转换 操作 符 。 

11. sizeof() 

这 个 运算 符 接收 一 个 输入 参数 ， 该 参数 可 以 是 一 个 变量 类 型 或 一 个 变量 自己 ， 返 回 该 变量 类 
型 (variable type) 或 对 象 (object) 所 占 的 字 节 数 ; 

















a = sizeof (char); 


会 返回 1 给 a， 因为 char 是 一 个 常 为 1 个 字 节 的 变量 类 型 。 
sizeof 返回 的 值 是 一 个 常数 ， 因 此 它 总 是 在 程序 执行 前 就 被 固定 了 。 


12. 运算 符 的 优先 级 

当 多 个 操作 数组 成 复杂 的 表达 式 时， 我 们 可 能 会 疑惑 哪个 运算 先 被 计算 ， 哪 个 后 被 计算 。 例 
如 以 下 表达 式 : 

8-534795 

我 们 可 以 怀疑 它 实际 上 表示 : 

a-5- (752) 结果 为 6, 还 是 a = (5 + 7) % 2 RAO? 

正确 答案 为 第 一 个 ， 结 果 为 6。 每 一 个 运算 符 有 一 个 固定 的 优先 级 ， 不 仅 对 数学 运算 符 〈 我 们 
在 学 习 数学 的 时 候 应 该 已 经 很 了 解 它 们 的 优先 顺序 了 ) ， 所 有 在 C++ 中 出 现 的 运算 符 都 有 优先 级 。 
从 高 到 低 ， 运 算 的 优先 级 按 表 3-4 排列 。 


X34 运算 的 优先 级 
优先 级 | 操作 符 说 明 结合 方向 


从 左 到 右 


从 左 到 右 
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结合 方向 定义 了 当 有 同 优先 级 的 多 个 运算 符 在 一 起 时 , 哪 一 个 必须 被 首先 运算 , 最 右边 的 还 是 
最 左边 的 。 

这 些 运算 符 的 优先 级 顺序 可 以 通过 使 用 圆 括号 来 控制 ， 有 了 括号 更 易 读 懂 ， 例 如 以 下 例子 : 

Aa=5+7% 2 

根据 我 们 想 要 实现 的 不 同 计算 ,可 以 写成 


5 二 (7582); 或 者 
(547) $2; 


a 
a 


如 果 你 想 写 一 个 复杂 的 表达 式 而 不 敢 肯 定 各 个 运算 的 执行 顺序 ， 就 加 上 括号 , 这 样 还 可 以 使 代 
码 更 易 读 懂 。 


3.1.11 REZE 
控制 台 〈console) 是 计算 机 的 基本 交互 接口 ， 通 常 包 括 键盘 (keyboard) 和 屏幕 (screen) 。 
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键盘 通常 为 标准 输入 设备 ， 而 屏幕 为 标准 输出 设备 。 

在 C++ 的 iostream 函数 库 中 ， 一 个 程序 的 标准 输入 输出 操作 依靠 两 种 数据 流 : cin 〈 给 输入 使 
用 ) 和 cout. 给 输出 使 用 ) 。 另 外 ，cerr 和 clog 也 已 经 被 实现 一 一 它们 是 两 种 特殊 设计 的 数据 流 ， 
专门 用 来 显示 出 错 信 息 ， 可 以 被 重新 定向 到 标准 输出 设备 或 一 个 日 志文 件 (log file) 。 

cout〔 标 准 输 出 流 ) 通常 被 定向 到 屏幕 ， 而 cin (标准 输入 流 ) 通常 被 定向 到 键盘 。 通 过 控制 
这 两 种 数据 流 , 你 可 以 在 程序 中 与 用 户 交互 ,因为 可 以 在 屏幕 上 显示 输出 并 从 键盘 接收 用 户 的 输入 。 


1. 输出 (cout) 
输出 流 cout 与 重 载 (overloaded) 运算 符 << 一 起 使 用 : 





cout << "Output sentence"; // 打印 0utput sentence 到 屏幕 上 
cout «« 120; // 打印 数字 120 到 屏幕 上 
cout << x; // 打印 变量 x 的 值 到 屏幕 上 


运算 符 << 又 叫 插入 运算 符 (insertion operator) ， 因 为 它 将 后 面 所 跟 的 数据 插入 它 前 面 的 数据 
流 中 。 在 以 上 例子 中 ， 字 符 串 常量 Output sentence、 数 字 常 量 120 和 变量 x 先后 被 插入 输出 流 cout 
中 。 注意 ， 第 一 句 中 的 字符 串 常量 是 被 双 引 号 引起 来 的 。 每 当 我 们 使 用 字符 串 常量 的 时 候 ， 必 须 用 
引号 把 字符 串 引 起 来 ， 以 便 将 它 和 变量 名 明显 地 区 分 开 来 。 例 如 ， 下 面 两 个 语句 是 不 同 的 : 


cout << "Hello"; // 打印 字符 串 Hello 到 屏幕 上 
cout «« Hello; // 把 变量 Hello 存 储 的 内 容 打印 到 屏幕 上 


插入 运算 符 (<<) 可 以 在 同一 语句 中 被 多 次 使 用 : 
cout << "Hello, " «« "I am " «« "a C++ sentence"; 


上 面 这 一 行 语句 将 会 打印 Hello, I am a C++ sentence. 到 屏幕 上 。 插入 运算 符 (<<) 的 重复 使 用 
在 我 们 想 要 打印 变量 和 内 容 的 组 合 内 容 或 多 个 变量 时 有 所 体现 : 

cout << "Hello, I am " << age «« " years old and my zipcode is " << zipcode; 

假设 变量 age 的 值 为 24, 变量 zipcode 的 值 为 90064, 以 上 句子 的 输出 将 为 : Hello, I am 24 years 


old and my zipcode is 90064. 
注意 ， 除 非 明确 指定 ，cout 并 不 会 自动 在 其 输出 内 容 的 末尾 加 换行 符 ， 因 此 下 面 的 语句 : 


cout << "This is a sentence."; 
cout << "This is another sentence."; 


将 会 有 如 下 内 容 输出 到 屏幕 : 
This is a sentence.This is another sentence. 


虽然 我 们 分 别 调用 了 两 次 cout， 但 是 两 个 句子 还 是 被 输出 在 同一 行 。 所 以 ， 为 了 在 输出 中 换 
行 ， 必 须 插入 一 个 换行 符 来 明确 表达 这 一 要 求 。 在 C++ 中 ， 换 行 符 可 以 写作 \n: 


cout << "First sentence.\n "7 
cout << "Second sentence. MnThird sentence."; 
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将 会 产生 如 下 输出 : 


First sentence. 
Second sentence. 
Third sentence. 


另外 ， 你 也 可 以 用 操作 符 endl 来 换行 ， 例 如 : 


cout << "First sentence." << endl; 
cout «« "Second sentence." «« endl; 


将 会 输出 : 


First sentence. 
Second sentence. 


我 们 可 以 使 用 \n ER endl 来 指定 cout 输出 换行 。 

2. 输入 ( cin ) 

在 C++ 中 ， 标 准 输入 是 通过 在 cin 数据 流 上 重 载运 算 符 >> 来 实现 的 。 它 后 面 必须 跟 一 个 变量 
以 便 存储 读 入 的 数据 ， 例 如 : 

int age; 

cin >> age; 

声明 一 个 整 型 变量 age， 然 后 等 待 用 户 从 键盘 输入 到 cin， 并 将 输入 值 存储 在 这 个 变量 中 。 

cin 只 能 在 键盘 上 按 回 车 键 (RETURN) 后 才能 处 理 前 面 输入 的 内 容 。 因 此 ， 即 使 你 只 要 求 输 
入 一 个 单独 的 字符 ， 在 用 户 按 回 车 键 (RETURN) 之 前 ，cin 将 不 会 处 理 用 户 输入 的 字符 。 

在 使 用 cin 输入 的 时 候 必须 考虑 后 面 的 变量 类 型 。 如 果 你 要 求 输入 一 个 整数 , >> 后 面 必 须 跟 一 
个 整 型 变量 ， 如 果 要 求 输入 一 个 字符 ， 后 面 必须 跟 一 个 字符 型 变量 ; 如果 要 求 输入 一 个 字符 串 , 后 
面 必须 跟 一 个 字符 串 型 变量 。 

【 例 3.7] cin 的 基本 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main () 
{ 
int. id; 
cout «« "Please enter an integer value: "; 
cin >> i; 
cout << "The value you entered is " << i; 


cout << " and its double is " «« i*2 << ".WAn"; 


return 0; 
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} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

Please enter an integer value: 5 

The value you entered is 5 and its double is 10. 


使 用 程序 的 用 户 可 能 是 引起 错误 的 原因 之 一 ， 即 使 是 在 简单 的 需要 用 cin 输入 的 程序 中 就 像 
上 面 这 个 程序 ) 。 如 果 你 要 求 输入 一 个 整数 数值 ， 而 用 户 输入 了 一 个 名 字 〈 一 个 字符 串 ) ， 其 结果 
可 能 导致 程序 产生 错误 操作 ,因为 它 不 是 我 们 期 望 从 用 户 处 获得 的 数据 。 当 你 使 用 由 cin 输入 的 数 
据 的 时 候 ， 你 不 得 不 假设 程序 的 用 户 将 会 完全 合作 而 不 会 在 程序 要 求 输入 整数 的 时 候 输入 他 的 名 
字 。 后 面 介绍 使 用 字符 串 的 时 候 ， 将 会 给 出 一 些 解决 这 一 类 出 错 问题 的 办 法 。 

你 也 可 以 利用 cin 要 求 用 户 输入 多 个 数据 : 


cin >> a >> b; 
等 同 于 : 


cin >> a; 
cin >> b; 


在 以 上 两 种 情况 下 ， 用 户 都 必须 输入 两 个 数据 ， 一 个 给 变量 a， 一 个 给 变量 b。 输 入 时 ， 两 个 
变量 之 间 可 以 以 任何 有 效 的 空白 符号 间隔 ， 包 括 空格 、 跳 跃 符 Cabo 或 换行 符 。 

3. cin 和 字符 串 

我 们 可 以 像 读 取 基 本 类 型 数据 一 样 ， 使 用 cin 和 >> 操 作 符 来 读 取 字 符 串 ， 例 如 : 

cin >> mystring; 


但 是 ，cin >> 只 能 读 取 一 个 单词 ， 一 旦 碰 到 任何 空格 ， 读 取 操作 就 会 停止 。 在 很 多 时 候 ， 这 
并 不 是 我 们 想 要 的 操作 ， 比 如 希望 用 户 输入 一 个 英文 句子 ， 那 么 这 种 方法 就 无 法 读 取 完 整 的 句子 ， 
因为 一 定 会 遇 到 空格 。 

要 一 次 读 取 一 整 行 输入 ， 需 要 使 用 C++ 的 函数 getline， 相 对 于 使 用 cin， 更 建议 使 用 getline 
来 读 取 用 户 输入 。 


【 例 3.8】 读 取 字 符 串 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
#include <string> 
using namespace std; 


int main () 


t 
string mystr; 
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cout << "What's your name? "7 

getline (cin, mystr); 

cout << Hello" << mystr << "Nnm 
cout << "What is your favorite color? "; 
getline (cin, mystr); 

cout «s TI liko ® ce myatr < "too! Nn" 
return 0; 


H 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

What's your name? zww 

Hello zww. 

What is your favorite color? black 

I like black too! 


你 可 能 注意 到 , 在 上 面 的 例子 中 , 两 次 调用 getline 函数 都 使 用 了 同一 个 字符 串 变量 (mystr) 。 
在 第 二 次 调用 的 时 候 ， 程 序 会 自动 用 第 二 次 输入 的 内 容 取代 以 前 的 内 容 。 

4. 字符 串 流 

标准 头 文件 <sstream> 定义 了 一 个 叫 作 stringstream 的 类 , 使 用 这 个 类 可 以 对 基于 字符 串 的 对 
象 进行 像 流 (stream) 一 样 的 操作 。 这 样 ， 我 们 可 以 对 字符 串 进行 抽取 和 插入 操作 ， 这 对 将 字符 串 
与 数值 互相 转换 非常 有 有 用。 例如， 我 们 想 将 一 个 字符 串 转换 为 一 个 整数 ， 可 以 这 样 写 ; 

string mystr ("1204"); 

int myint; 

stringstream(mystr) »» myint; 

这 个 例子 中 先 定 义 了 一 个 字符 串 类 型 的 对 象 mystr， 初 始 值 为 1204， 又 定义 了 一 个 整数 变量 
myint。 然 后 使 用 stringstream 类 的 构造 函数 定义 了 这 个 类 的 对 象 ， 并 以 字符 串 变 量 mystr 为 参数 。 
因为 我 们 可 以 像 使 用 流 一 样 使 用 stringstream 的 对 象 ， 所 以 可 以 像 使 用 cin 那样 使 用 操作 符 ，>> 后 
面 跟 一 个 整数 变量 来 提取 整数 数据 。 这 段 代 码 执行 之 后 变量 myint 存储 的 是 数值 1204。 


【 例 3.9】 字 符 串 流 的 使 用 
(OD 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
#include <string> 
#include <sstream> 
using namespace std; 


int main () 

t 
string mystr; 
float price-0; 
int quantity-0; 





C++ 语言 基础 第 3 党 





cout «« "Enter price: "; 

getline (cin,mystr); 

stringstream(mystr) >> price; 

cout «« "Enter quantity: "; 

getline (cin,mystr); 

Sstringstream(mystr) >> quantity; 

cout «« "Total price: " «« price*quantity «« endl; 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

Enter price: 5 

Enter quantity: 5 

Total price: 25 

在 这 个 例子 中 , 我 们 要 求 用 户 输入 数值 ， 但 不 同 于 从 标准 输入 中 直接 读 取 数值 , 我 们 使 用 函数 
getline 从 标注 输入 流 cin 中 读 取 字符 串 对 象 mystr) ， 再 从 这 个 字符 串 对 象 中 提取 数值 price 和 
quantity。 

通过 使 用 这 种 方法 ， 我 们 可 以 对 用 户 的 输入 有 更 多 的 控制 ， 因 为 它 将 用 户 输入 与 对 输入 的 解 
释 分 离 ， 只 要 求 用 户 输入 整 行 的 内 容 ， 再 对 用 户 输入 的 内 容 进 行 检验 操作 。 这 种 做 法 在 用 户 输入 比 
较 集 中 的 程序 中 是 非常 推荐 使 用 的 。 


3.2 ”控制 结构 


一 个 程序 的 语句 往往 并 不 仅 限于 线性 顺序 结构 。 在 程序 的 执行 过 程 中 ， 可 能 被 分 成 两 支 执行 ， 
可 能 重复 某 些 语句 ， 也 可 能 根据 一 些 判断 结果 而 执行 不 同 的 语句 。 因 此 ，C++ 提 供 一 些 控制 结构 语 
句 〈control structures). 来 实现 这 些 执行 顺序 。 

为 了 介绍 程序 的 执行 顺序 ， 我 们 需要 先 介 绍 一 个 新 概念 : 语句 块 Clock of instructions) 。 一 
个 语句 块 〈A block of instructions) 是 一 组 互相 之 间 由 分 号 〈;) 分 隔 开 但 整体 被 花 括号 ({}) 括 起 
来 的 语句 。 

本 节 中 将 看 到 大 多 数控 制 结 构 允 许 一 个 通用 的 statement 做 参数 , 这 个 statement 根据 需要 可 以 
是 一 条 语句 ， 也 可 以 是 一 组 语句 组 成 的 语句 块 。 如 果 我 们 只 需要 一 条 语句 做 statement， 它 可 以 不 
被 括 在 花 括号 P 内 。 但 若 需要 多 条 语句 共同 做 statement， 则 必须 把 它们 括 在 花 括号 内 ({}) ， 
以 组 成 一 个 语句 块 。 


3.2.1 条 件 结构 
条 件 结构 用 来 实现 仅 在 某 种 条 件 满足 的 情况 下 才 执 行 一 条 语句 或 一 个 语句 块 。 它 的 形式 是 : 


if (condition) statement 
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这 里 condition 是 一 个 将 被 计算 的 表达 式 Cexpression) 。 如果 表达 式 值 为 真 , 即 条 件 (condition) 
为 true, statement 将 被 执行 。 否 则 ，statement 将 被 忽略 〈 不 被 执行 ) ， 程 序 从 整个 条 件 结构 之 后 
的 下 一 条 语句 继续 执行 。 

例如 ， 以 下 程序 段 实 现 只 有 当 变 量 x 存储 的 值 确实 为 100 的 时 候 才 输出 “xis 100”: 


if (x — 100) 
cout «« "x is 100"; 


如 果 我 们 需要 在 条 件 为 真 的 时 候 执行 一 条 以 上 的 语句 ， 可 以 用 花 括 号 〈{}) 将 语句 括 起 来 组 
成 一 个 语句 块 : 

if (x == 100) 

{ 

Cout ec "x ds" 


cout << x; 


) 


我 们 可 以 用 关键 字 else 来 指定 当 条 件 不 能 被 满足 时 需要 执行 的 语句 ， 它 需要 和 if 一 起 使 用 ， 
形式 是 : 


if (condition) statementl else statement2 
例如 : 


if (x == 100) 

coub << mirre 10077 
else 

cout << "x is not 100"; 


以 上 程序 如 果 x 的 值 为 100， 就 在 屏幕 上 打出 x is 100， 如 果 x 不 是 100， 而 且 也 只 有 x 不 是 
100 的 时 候 ， 屏 幕 上 将 打出 x is not 100。 

£^ if-- else 的 结构 被 连接 起 来 使 用 来 判断 数值 的 范围 .以 下 例子 显示 如 何 用 它 来 判断 变量 x 
中 当前 存储 的 数值 是 正 值 、 负 值 还 是 既 不 是 正 值 也 不 是 负 值 〈 即 等 于 0) 

if (x > 0) 

cout << "x is positive"; 

else if (x < 0) 

cout << "x is negative"; 


else 
cout << "x is OF 


注意 ， 当 我 们 需要 执行 多 条 语句 时 ， 必 须 使 用 花 括 号 “{}” 将 它们 括 起 来 以 组 成 一 个 语句 块 。 


3.22 ”循环 结构 


循环 的 目的 是 重复 执行 一 组 语句 一 定 的 次 数 或 直到 满足 某 种 条 件 。 循 环 结构 有 while 循环 、 
do-while 循环 和 for 循环 。 
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1. while 循环 
while 循环 语句 的 格式 是 : 
while (表达 式 expression) 语句 statement 


它 的 功能 是 当 expression 的 值 为 true 时 重复 执行 statement。 
例如 ， 下 面 将 用 while 循环 来 写 一 个 倒 计 数 程序 。 


【 例 3.10】while 循环 结构 的 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
int main () 
t 
int ns 
cout «« "Enter the starting number » "; 
cin >> n; 
while (n>0) { 
Coue LA n Le myo ny 
--n; 
) 
cout << "FIRE! Mn"; 
return 0; 


) 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

Enter the starting number > 10 

078 Or SERIO S Ar Re 


程序 开始 时 提示 用 户 输入 一 个 倒 计 数 的 初始 值 。 然后 while 循环 开始 , 如 果 用 户 输入 的 数值 满 
足 条 件 n>0 CHI n 比 0 大 ) ， 后 面 跟 的 语句 块 将 会 被 执行 一 定 的 次 数 ， 直 到 条 件 (n>0) 不 再 满足 
CENX false) 。 
以 上 程序 的 所 有 处 理 过 程 可 以 用 以 下 描述 来 解释 。 
从 main 开始 : 


用 户 输入 一 个 数值 赋 给 n。 

while 语 句 检查 (n>0) 是 否 成 立 ， 这 时 有 两 种 可 能 : 
true: 执行 statement (到 第 3 步 ) 。 
false: 跳 过 statement， 程序 直接 执行 第 5 步 。 

执行 statement : 

cout «« n «« ", "; 

1 

(将 n 的 值 打印 在 屏幕 上 ， 然 后 将 n 的 值 减 1) 

语句 块 结束 ， 自 动 返回 第 2 步 。 
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继续 执行 语句 块 之 后 的 程序 : 打印 FIRE! ， 程 序 结束 。 
我 们 要 考虑 到 循环 必须 在 某 个 点 结束 ， 因 此 在 语句 块 之 内 Cloop 的 statement 之 内 ) 必须 提供 
一 些 方法 使 得 条 件 可 以 在 某 个 时 刻 变 为 假 ， 否 则 循环 将 无 限 重复 下 去 。 在 这 个 例子 里 ， 我 们 用 语句 
--0; 使 得 循环 在 重复 一 定 的 次 数 后 变 为 false: 当 n 变 为 0 时 ， 倒 计数 结束 。 
2. do-while 循环 
do-while 循环 语句 的 格式 是 : 





do 语句 statement while (条 件 condition); 


它 的 功能 与 while 循环 一 样 ， 除 了 在 do-while 循环 中 是 先 执行 statement. 然后 才 检 查 条 件 
(condition》， 而 不 像 while 循环 中 先 检查 条 件 然后 才 执 行 statement。 这 样 ， 即 使 条 件 从 来 没有 被 
W, statement 仍 至 少 被 执行 一 次 。 例 如 ， 下 面 的 程序 重复 输出 (echoes〉 用 户 输 入 的 任何 数 
值 ， 直 到 用 户 输入 0 为止 。 


【 例 3.11]. do-while 的 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
int main () 
t 
unsigned long n; 
do ( 
cout «« "Enter number (0 to end): "; 
cin >> n; 
cout << "You entered: " << n << "An"; 
) while (n !- 0); 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

Enter number (0 to end): 5 

You entered: 5 

Enter number (0 to end): 0 

You entered: 0 

do-while 循环 通常 被 用 在 判断 循环 结束 的 条 件 是 在 循环 语句 内 部 被 决定 的 情况 下 , 比如 以 上 的 
例子 ， 在 循环 的 语句 块 内 ， 用 户 的 输入 决定 了 循环 是 否 结束 。 如 果 用 户 永远 不 输入 0， 循 环 就 永远 
不 会 结束 。 


3. for 循环 
for 循环 语句 的 格式 是 : 
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for (initialization; condition; increase) statement; 


它 的 主要 功能 是 当 条 件 condition 为 真 时 ， 重 复 执 行 语句 statement ， 类 似 while 循环 。 但 除 此 
之 外 ，for 还 提供 了 写 初 始 化 语句 initialization 和 增值 语句 increase 的 地 方 。 因 此 ， 这 种 循环 结构 
是 特别 为 执行 由 计数 器 控制 的 循环 而 设计 的 。 

按 以 下 方式 工作 : 


(1) 执行 初始 化 initialization。 通 常 是 设置 一 个 计数 器 变量 (counter variable) 的 初始 值 ， 初 
始 化 仅 被 执行 一 次 。 

(2) 检查 条 件 condition, 如 果 条 件 为 真 , 就 继续 循环 , 否则 循环 结束 , 循环 中 的 语句 statement 
被 跳 过 。 

(3) 执 行 语句 statement. 像 以 前 一 样 , 它 可 以 是 一 个 单独 的 语句 , 也 可 以 是 一 个 由 花 括号 ({ }) 
括 起 来 的 语句 块 。 

(4) 最 后 增值 域 (increase field) 中 的 语句 被 执行 ， 循 环 返 回 第 2 步 。 注 意 ， 增 值 域 中 可 能 是 
任何 语句 ， 而 不 一 定 只 是 将 计数 器 增加 的 语句 。 例如 下 面 的 例子 中 ,计数 器 实际 为 减 1， 而 不 是 加 1。 

下 面 是 用 for 循环 实现 的 倒 计 数 的 例子 。 

【 例 3.12】for 循环 的 使 用 

(1) 打开 UE， 输 入 代码 如 下 : 














#include <iostream> 
using namespace std; 
int main () 
{ 
for (int n=10; n>0; n--) { 
COUE «« n «e €", "; 
) 
cout << "FIRE! Mn"; 
return 0; 


H 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[rootélocalhost test]# ./test 

10, 9, 8, 7, 6, 5, 4, 3, 2, 1, FIRE! 

初始 化 initialization 和 增值 increase. 域 是 可 选 的 〈 可 以 为 空 ) 。 但 这 些 域 为 空 的 时 候 ， 它 们 和 
其 他 域 之 间 间 隔 的 分 号 不 可 以 省 略 。 例 如 ， 我 们 可 以 写 for (;n<10;) 来 表示 没有 初始 化 和 增值 语句 ， 
或 for (;n«10;n-—) 来 表示 有 增值 语句 但 没有 初始 化 语句 。 

另外 ， 我 们 也 可 以 在 for 循环 初始 化 或 增值 域 中 放 一 条 以 上 的 语句 ， 中 间 用 逗号 (，) 隔 开 。 
例如 ， 假 设想 在 循环 中 初始 化 一 个 以 上 的 变量 ， 可 以 用 以 下 程序 来 实现 : 

for ( n=0, i=100 ; n!=i ; ntt, i=- ) 

t 


// whatever here... 
) 
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如 果 n 和 i 在 循环 内 部 都 不 被 改变 ， 这 个 循环 将 被 执行 50 次 。 

n 的 初始 值 为 0，i 的 初始 值 为 100， 条 件 是 n!=i On 不 能 等 于 i) 。 因 为 每 次 循环 n 加 1， 而 且 
i 减 1， 循环 的 条 件 将 会 在 第 50 次 循环 之 后 变 为 假 (n 和 i 都 等 于 50〉。 
3.2.3 分支 控制 和 跳 转 


1. break 语句 

通过 使 用 break 语句 ， 即 使 在 结束 条 件 没 有 满足 的 情况 下 ， 我 们 也 可 以 跳出 一 个 循环 。 它 可 以 
被 用 来 结束 一 个 无 限 循环 (infinite loop) ， 或 强迫 循环 在 其 自然 结束 之 前 结束 。 例 如 ， 我 们 想 要 在 
倒 计 数 自然 结束 之 前 强迫 它 停止 〈 也 许 因为 一 个 引擎 故障 ) 。 

【 例 3.13】break 语句 的 使 用 

(1) 打开 UE， 输 入 代码 如 下 : 





#include <iostream> 
using namespace std; 


int main () 
t 
int n; 
for (n=10; n>0; n--) 
t 
COUE ZED LE Ims 
if (n==3) 
t 
cout «« "countdown aborted!"; 
break; 
) 
} 
return 0; 


H 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
10, 9, 8, 7, 6, 5, 4, 3, countdown aborted! 


2. continue 语句 
continue 语句 使 得 程序 跳 过 当前 循环 中 剩 下 的 部 分 而 直接 进入 下 一 次 循环 , 就 好 像 循环 中 语 
块 的 结尾 已 经 到 了 使 得 循环 进入 下 一 次 重复 。 例如， 下 面 的 例子 中 ， 倒 计数 时 ， 我 们 将 跳 过 数字 5 
的 输出 。 
【 例 3.14】continue 语句 的 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
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int main () 
t 
for (int n=10; n20; n-=) { 
if (n==5) continue; 
COUE SSMS S 
) 
cout << "FTRE!"; 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

10, 9, 8, 7, 6, 4, 3, 2, 1, FIRE! 

3. goto 语句 

通过 使 用 goto 语句 可 以 使 程序 从 一 点 跳 转 到 另 一 点 。 注 意 必须 谨慎 使 用 这 条 语句 ， 因 为 它 的 
执行 可 以 忽略 任何 嵌 套 限制 。 

跳 转 的 目标 点 可 以 由 一 个 标识 符 〈label) 来 标明 ， 该 标识 符 作为 goto 语句 的 参数 。 一 个 标识 
符 由 一 个 标识 名 称 后 面 跟 一 个 冒号 CO 组 成 。 

通常 除了 底层 程序 爱好 者 使 用 这 条 语句 外 ， 它 在 结构 化 或 面向 对 象 的 编程 中 并 不 常用 。 下 面 
的 例子 中 用 goto 来 实现 倒 计 数 循环 。 


【 例 3.15】goto 语句 的 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main () 
t 
int n-10; 
loop: 
COUE KE shes dm tun 
ncc, 
if (n>0) goto loop; 
cout << "FIRE! Mn"; 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 
10, 9, By Tp 6p Sr Arp 3, 2p 1, FIRE! 
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3.2.4 选择 结构 语句 switch 


switch 语句 的 语法 比较 特殊 ， 目 标 是 对 一 个 表达 式 检查 多 个 可 能 的 常量 值 ， 有 些 像 我 们 在 前 
面 学 习 的 把 几 个 让 和 elseif 语句 连接 起 来 的 结构 。 它 的 形式 是 : 

switch (expression) ( 

case constantl: 

block of instructions 1 

break; 

case constant2: 

block of instructions 2 

break; 


default: 
default block of instructions 


) 


按 以 下 方式 执行 : 

switch 计算 表达 式 〈expression ) 的 值 ， 并 检查 它 是 否 与 第 一 个 常量 constantl 相等 , 如 果 相 等 ， 
程序 执行 常量 1 后 面 的 语句 块 block of instructions 1 直到 碰 到 关键 字 break ,程序 跳 转 到 switch 选 
择 结构 的 结尾 处 。 

WR expression 不 等 于 constant1， 程 序 检查 表达 式 expression. 的 值 是 否 等 于 第 二 个 常量 
constant2， 如 果 相 等 ,程序 将 执行 常量 2 后 面 的 语句 块 block of instructions 2 直到 碰 到 关键 字 break。 

以 此 类 推 ， 直 到 最 后 表达 式 expression. 的 值 不 等 于 任何 前 面 的 常量 (你 可 以 用 case 语句 指明 
任意 数量 的 常量 值 来 要 求 检 查 ), 程序 将 执行 默认 区 default: 后 面 的 语句 , 如 果 它 存在 的 话 。default: 
选项 是 可 以 省 略 的 。 

表 3-5 中 的 两 段 代 码 段 功能 相同 。 


表 3-5 switch 5 if-else 代码 段 








Switch if-else 

switch (x) { if(x==1){ 
case 1: cout << "x is 1": 
cout << "x is 1"; } 

break; else if (x == 2) { 
case 2: cout << "x is 2"; 
cout << "x is 2"; } 

break; else { 

default: cout << "value of x unknown"; 
cout << "value of x unknown"; } 

} 
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前 面 已 经 提 到 switch 的 语法 有 点 特殊 。 注 意 每 个 语句 块 结尾 包含 的 break 语句 ， 这 是 必需 的 ， 
如 果 不 这 样 做 ， 例 如 在 语句 块 block of instructions 1 的 结尾 没有 break， 程 序 执行 将 不 会 跳 转 到 
switch 选择 的 结尾 处 〈}) ， 而 是 继续 执行 下 面 的 语句 块 ， 直 到 第 一 次 遇 到 break 语句 或 到 switch 
选择 结构 的 结尾 。 因 此 ， 不 需要 在 每 一 个 case 域内 加 花 括 号 “{}”。 这 个 特点 同时 可 以 帮助 实现 
对 不 同 的 可 能 值 执行 相同 的 语句 块 ， 例 如 : 

switch (x) ( 

case 1: 

case 2: 

case 3: 

cout «« "x is 1, 2 or 3"; 

break; 

default: 

Cout << x iS NOt ly 2 nor 3"? 

} 

注意 ，switch 只 能 被 用 来 比较 表达 式 和 不 同 常量 的 值 Constants) 。 因 此 ， 我 们 不 能 够 把 变量 
或 范围 放 在 case 之 后 ， 例 如 (case (n*2):) 或 (case (1..3):) 都 不 可 以 ， 因 为 它们 不 是 有 效 的 常量 。 
如 果 你 需要 检查 范围 或 非常 量 数值 ， 可 使 用 连续 的 让 和 else if 语句 。 


3.3 函数 


通过 使 用 函数 (functions) 可 以 把 程序 以 更 模块 化 的 形式 组 织 起 来 ， 从 而 利用 C++ 所 能 提供 的 
所 有 结构 化 编程 的 潜力 。 
一 个 函数 (unction) 是 一 个 可 以 从 程序 其 他 地 方 调用 执行 的 语句 块 。 以 下 是 它 的 格式 : 


type name ( argumentl, argument2, ...) statement 


其 中 : 

type 是 函数 返回 的 数据 的 类 型 。 

name 是 函数 被 调用 时 使 用 的 名 。 

argument. 是 函数 调用 需要 传 入 的 参量 (可 以 声明 任意 多 个 参量 ) 。 每 个 参量 由 一 个 数据 类 型 
后 面 跟 一 个 标识 名 称 组 成 ， 就 像 变量 声明 中 一 样 〈 例 如 int x)。 参 量 仅 在 函数 范围 内 有 效 ， 可 以 
和 函数 中 的 其 他 变量 一 样 使 用 ， 它们 使 得 函数 在 被 调用 时 可 以 传 入 参数 , 不 同 的 参数 用 逗号 隔 开 。 

statement. 是 函数 的 内 容 。 它 可 以 是 一 句 指令 ， 也 可 以 是 一 组 指令 组 成 的 语句 块 。 如 果 是 一 组 
指令 ,语句 块 就 必须 用 花 括 号 “{}” 插 起 来 ,这 也 是 我 们 常见 到 的 情况 。 为 了 使 程序 的 格式 更 加 统 
一 、 清 晰 ， 建 议 在 仅 有 一 条 指令 的 时 候 也 使 用 花 括号 ， 这 是 一 个 良好 的 编程 习惯 。 


【 例 3.16】 第 一 个 函数 例子 
(1) 打开 UE， 输 入 代码 如 下 : 





#include <iostream> 
using namespace std; 
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int addition (int a, int b) 
t 

int r; 

r-atb; 

return (r); 


) 


int main () 
t 
int z; 
z = addition (5,3); 
cout << "The result is " << z««endl; 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

The result is 8 

记得 在 本 章 开始 时 说 过 : 一 个 C++ 程序 总 是 从 main 函数 开始 执行 。 

可 以 看 到 ，main 函数 以 定义 一 个 整 型 变量 z 开始 。 紧 跟着 调用 addition 函数 。 函 数 调用 的 写 
法 和 上 面 的 函数 定义 本 身 十 分 相似 。 

参数 有 明显 的 对 应 关系 。 在 main. 函数 中 ,我 们 调用 addition. 函数 ,并 传 入 两 个 数值 : 5 和 3， 
它们 对 应 函数 addition 中 定义 的 参数 inta 和 intb。 

当 函 数 在 main 中 被 调用 时 ， 程 序 执行 的 控制 权 从 main 转移 到 函数 addition。 调 用 传递 的 两 个 
参数 的 数值 (5 和 3) 被 复制 到 函数 的 本 地 变量 (local variables) inta 和 intb 中 。 

函数 addition 中 定义 了 新 的 变量 (int r;) ， 通 过 表达 式 r=a+b: 把 a 加 b 的 结果 赋 给 r。 因 为 传 
过 来 的 参数 a 和 的 值 分 别 为 5 和 3， 所 以 结果 是 8。 

下 面 一 行 代码 : 


return (r); 


结束 函数 addition， 并 把 控制 权 交 还 给 调用 它 的 函数 (main)， 从 调用 addition 的 地 方 开始 继续 向 
下 执行 。 另 外 ，return 在 调用 的 时 候 后 面 跟着 变量 r (retum(nD;) ， 它 当时 的 值 为 8， 这 个 值 被 称 为 
函数 的 返回 值 。 

函数 返回 的 数值 就 是 函数 的 计算 结果 ， 因 此 ，z 将 存储 函数 addition (5, 3) 返 回 的 数值 ， 即 8。 
用 另 一 种 方式 解释 ， 你 也 可 以 想象 成 调用 函数 (addition (5.3)) 被 蔡 换 成 了 它 的 返回 值 8。 

接 下 来 main 中 的 下 一 行 代码 是 : 








cout «« "The result is " «« z; 


这 行 代码 把 结果 打印 在 屏幕 上 。 
值得 注意 的 是 变量 的 范围 ， 我 们 必须 考虑 到 变量 的 范围 只 是 在 定义 该 变量 的 函数 或 指令 块 内 
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有 效 ， 而 不 能 在 它 的 函数 或 指令 块 之 外 使 用 。 例 如 ， 在 上 面 的 例子 中 就 不 可 能 在 main. 中 直接 使 用 
变量 a、b 或 "， 因 为 它们 是 函数 addition 的 本 地 变量 。 在 函数 addition 中 也 不 可 能 直接 使 用 变量 z 
因为 它 是 main 的 本 地 变量 。 

因此 ， 本 地 变量 的 范围 是 局 限于 声明 它 的 嵌 套 范围 之 内 的 。 尽 管 如 此 ， 你 还 可 以 定义 全 局 变 
量 (global variables) ， 它 们 可 以 在 代码 的 任何 位 置 被 访问 ， 不 管 在 函数 以 内 还 是 以 外 。 要 定义 全 
局 变量 ， 必 须 在 所 有 函数 或 代码 块 之 外 定义 它们 ， 也 就 是 说 ， 直 接 在 程序 体 中 声明 它们 。 

【 例 3.17】 第 二 个 函数 的 例子 

(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int subtraction (int a, int b) 


t 
int r; 
r-a-b; 
return (r); 
) 


int main () 
t 
int x-5, y=3, z; 
z = subtraction (7,2); 
cout << "The first result is " << z << '\n'; 
cout << "The second result is " << subtraction (7,2) << '\n'; 
cout << "The third result is " << subtraction (x,y) << 'Mn'; 
z- 4 * subtraction (x,y); 
cout << "The fourth result is " << z << 'An'; 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

The first result is 5 

The second result is 5 

The third result is 2 

The fourth result is 6 


在 这 个 例子 中 ， 我 们 定义 了 函数 subtraction。 这 个 函数 的 功能 是 计算 传 入 的 两 个 参数 的 差 值 并 
将 结果 返回 。 

在 main 函数 中 ， 函 数 subtraction 被 调用 了 多 次 。 我 们 用 了 几 种 不 同 的 调用 方法 ， 因 此 可 以 
看 到 在 不 同情 况 下 函数 如 何 被 调用 。 

为 了 更 好 地 理解 这 些 例 子 ， 你 需要 考虑 到 被 调用 的 函数 其 实 完全 可 以 由 它 所 返回 的 值 来 代 蔡 。 
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例如 在 上 面 的 例子 中 , 第 一 种 情况 下 (这 种 调用 你 应 该 已 经 知道 了 ,因为 在 前 面 的 例子 中 已 经 用 过 
这 种 形式 的 调用 ) : 


z = subtraction (7,2); 
cout << "The first result is " << z; 


如 果 我 们 把 函数 调用 用 它 的 结果 (也 就 是 5) RER, HE: 


z= 5; 
cout «« "The first result is " << z; 


同样 地 : 
cout << "The second result is " << subtraction (7,2); 


与 前 面 的 调用 有 同样 的 结果 , 但 在 这 里 我 们 把 对 函数 subtraction 的 调用 直接 用 作 cout 的 参数 。 
可 以 简单 想象 成 写 的 是 : 


cout << "The second result is " «« 5; 

因为 5 Jé subtraction (7,2) 的 结果 。 在 下 面 一 行 语句 中 

cout << "The third result is " << subtraction (x,y); 
与 前 面 的 调用 唯一 的 不 同 之 处 是 ， 这 里 调用 subtraction 时 的 参数 使 用 的 是 变量 而 不 是 常量 。 这 样 
用 是 毫 无 问题 的 。 在 这 个 例子 里 ， 传 入 函数 subtraction 的 参数 值 是 变量 x 和 y 中 存储 的 数值 ， 即 


分 别 为 5 和 3， 结 果 为 2。 
第 4 种 调用 也 是 一 样 的 。 只 要 知道 除了 : 


z = 4 + subtraction (x,y); 
也 可 以 写成 : 
z = subtraction (x,y) + 4; 
它们 的 结果 是 完全 一 样 的。 注意 在 整个 表达 式 的 结尾 写 上 分 号 。 
没有 返回 值 类 型 的 函数 使 用 void。 
如 果 你 记得 函数 声明 的 格式 : 
type name ( argumentl, argument2 ...) statement 


就 会 知道 函数 声明 必须 以 一 个 数据 类 型 (type) 开头 ， 它 是 函数 由 retum 语句 所 返回 的 数据 类 型 。 
但 是 如 果 我 们 并 不 打算 返回 任何 数据 ， 那 该 怎么 办 呢 ? 

假设 我 们 要 写 一 个 函数 ， 它 的 功能 是 在 屏幕 上 打印 一 些 信息 。 我 们 不 需要 它 返 回 任何 值 ， 而 
且 也 不 需要 它 接收 任何 参数 。C 语言 为 这 些 情况 设计 了 void 类 型 。 让 我 们 来 看 一 下 下 面 的 例子 。 
【 例 3.18】 第 三 个 函数 的 例子 

(1) 打开 UE， 输 入 代码 如 下 : 
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#include <iostream> 
using namespace std; 


void printmessage () 
t 
cout «« "I'm a function!"; 


) 


int main () 

t 
printmessage (); 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

I'm a function! 

void 还 可 以 被 用 在 函数 参数 的 位 置 ， 表 示 我 们 明确 希望 这 个 函数 在 被 调用 时 不 需要 任何 参数 。 
例如 上 面 的 函数 printmessage 也 可 以 写 为 以 下 形式 : 

void Printmessage (void) 

t 

cout «« "I'm a function!"; 

) 

虽然 在 C++ 中 void 可 以 被 省 略 ， 但 是 还 是 建议 写 出 void， 以 便 明确 指出 函数 不 需要 参数 。 

注意 ， 在 调用 一 个 函数 时 ， 要 写 出 它 的 名 字 并 把 参数 写 在 后 面 的 括号 内 。 但 如 果 函 数 不 需 要 
参数 ， 后 面 的 括号 并 不 能 省 略 。 因 此 ， 调 用 函数 printmessage 的 格式 是 : 


printmessage(); 


函数 名 称 后 面 的 括号 就 明确 表示 了 它 是 一 个 函数 调用 ， 而 不 是 一 个 变量 名 称 或 其 他 什么 语句 。 
以 下 调用 函数 的 方式 就 不 对 : 


printmessage; 


3.4 ARADEA 


3.4.1 参数 按 数 值 传递 和 按 地 址 传递 


到 目前 为 止 , 我 们 看 到 的 所 有 函数 中 ， 传递 到 函数 中 的 参数 全 部 是 按 数值 传递 的 (by value) 。 
也 就 是 说 , 当 我 们 调用 一 个 带 有 参数 的 函数 时 , 传递 到 函数 中 的 是 变量 的 数值 而 不 是 变量 本 身 。 例 
如 ， 用 下 面 的 代码 调用 我 们 的 第 一 个 函数 addition: 
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int x-5, y-3, z; 

z = addition ( x , y ); 

在 这 个 例子 里 ， 我 们 调用 函数 addition， 同 时 将 x 和 y 的 值 传 给 它 ， 即 分 别 为 5 和 3， 而 不 是 
两 个 变量 ， 如 图 3-2 所 示 。 





图 3-2 


这 样 ， 当 函数 addition 被 调用 时 ， 它 的 变量 a RI 的 值 分 别 变 为 5 和 3， 但 在 函数 addition 内 ， 
对 变量 a 或 b 所 做 的 任何 修改 都 不 会 影响 函数 外 面 的 变量 x 和 y 的 值 , 因为 变量 x 和 y 并 没有 把 它 
们 自己 传递 给 函数 ， 而 只 是 传递 了 它们 的 数值 。 

但 在 某 些 情况 下 ， 你 可 能 需要 在 一 个 函数 内 控制 一 个 函数 以 外 的 变量 。 要 实现 这 种 操作 ， 我 
们 必须 使 用 按 地 址 传递 的 参数 (arguments passed by reference) , 就 像 下 面 的 例子 中 的 函数 duplicates 


【 例 3.19】 按 地 址 传递 参数 的 函数 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


void duplicate (int& a, int& b, int &c) 
t 

a *= 2; 

b wm 2; 

© *e 27 


) 


int main() 
t 
int x = 1, y = 3, z = 7; 
duplicate (x, y, z); 
Cout «€ "x-" «€ x CR ", yz" LL y «€ ", z-" «« z««end1; 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost ~]# cd /zww/test 

[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

x=2, y=6, z=14 

第 一 个 应 该 注意 的 是 ， 在 函数 duplicate 的 声明 (declaration) 中 ， 每 一 个 变量 类 型 的 后 面 跟 了 
一 个 地 址 符 (&)， 它 的 作用 是 指明 变量 是 按 地 址 传递 的 (by reference) ， 而 不 是 按 数值 传递 的 (by 
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value) 。 
当 按 地 址 传递 一 个 变量 的 时 候 ， 我 们 是 在 传递 这 个 变量 本 身 ， 在 函数 中 对 变量 所 做 的 任何 修 
改 将 会 影响 函数 外 面 被 传递 的 变量 ， 如 图 3-3 所 示 。 


图 3-3 


用 另 一 种 方式 来 说 ,我 们 已 经 把 变量 a、b、c 和 调用 函数 时 使 用 的 参数 (x、y 和 z) 联系 起 来 
了 ， 因 此 如 果 我 们 在 函数 内 对 a 进行 操作 ， 函 数 外 面 x 的 值 也 会 改变 。 同 样 ， 任 何 对 b 的 改变 也 会 
影响 y， 对 c 的 改变 也 会 影响 zo 

这 就 是 上 面 的 程序 中 ， 主 程序 main 中 的 3 个 变量 x、y 和 z 在 调用 函数 duplicate 后 ， 打 印 结 
果 显 示 它 们 的 值 增 加 了 一 倍 的 原因 。 

如 果 在 声明 下 面 的 函数 时 : 


void duplicate (int& a, int& b, int& c); 
我 们 是 按 这 样 声明 的 : 

void duplicate (int a, int b, int c) 
也 就 是 不 写 地 址 符 (&) ， 也 就 没有 将 参数 的 地 址 传递 给 函数 ， 而 是 传递 了 它们 的 值 ， 因 此 ， 屏 幕 
上 显示 的 输出 结果 x、 y 、z 的 值 将 不 会 改变 ， 仍 是 1、3、7。 

值得 注意 的 是 , 这 种 用 地 址 符 (&) 来 声明 按 地 址 传递 参数 的 方式 只 是 在 C++ 中 适用 。 在 C 语 
言 中 ， 我 们 必须 用 指针 pointers) 来 做 相同 的 操作 。 

按 地 址 传递 是 一 个 使 函数 返回 多 个 值 的 有 效 方法 。 例 如 ， 下 面 是 一 个 函数 ， 可 以 返回 第 一 个 
输入 的 参数 的 前 一 个 和 后 一 个 数值 。 

【 例 3.20】 按 地 址 传递 是 使 函数 返回 多 个 值 

(1) 打开 UE， 输 入 代码 如 下 : 





#include <iostream> 
using namespace std; 


void prevnext (int x, int& prev, int& next) 
t 

prev = x - 1; 

next = x + 1; 


b 


int main() 

t 
int x = 100, y, Zz? 
prevnext (x, y, Z); 


«29e 
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cout << "Previous-" «« y «« ", Next-" «« z««endl; 
return 0; 


} 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
Previous=99, Next=101 


参数 的 默认 值 


当 声 明 一 个 函数 的 时 候 ， 我 们 可 以 给 每 一 个 参数 指定 一 个 默认 值 。 如 果 函 数 被 调用 时 没有 给 
出 该 参数 的 值 , 那么 这 个 默认 值 将 被 使 用 。 指定 参数 默认 值 只 需要 在 声明 函数 时 把 一 个 数值 赋 给 参 
数 。 如 果 函 数 被 调用 时 没有 数值 传递 给 该 参数 ， 那 么 默认 值 将 被 使 用 。 但 如 果 已 将 指定 的 数值 传递 
给 参数 ， 那 么 默认 值 将 被 指定 的 数值 取代 。 看 下 面 一 段 小 程序 : 

#include <iostream.h> 

int divide (int a, int b-2) ( 

int r; 

r-a/b; 

return (r); 


) 


int main () ( 

cout «« divide (12); 

cout «« endl; 

cout << divide (20,4); 

return 0; 

) 

我 们 可 以 看 到 divide 在 定义 的 时 候 ， 第 二 个 参数 b 被 赋值 为 2， 表示 如 果 调 用 divide 的 时 候 ， 
没有 给 定 第 二 个 实际 参数 ， 则 使 用 默认 值 2 作为 实际 参数 。 在 程序 中 有 两 次 调用 函数 divide。 第 一 
次 调用 : 

divide (12) 
只 有 一 个 参数 被 指明 , 因此 函数 divide 就 用 默认 值 2 作为 第 二 个 参数 的 值 , 这 次 函数 调用 的 结果 是 
6 (12/2) 。 

在 第 二 次 调用 中 : 

divide (20,4) 


这 里 有 两 个 参数 ,所 以 默认 值 (int b=2) 被 传 入 的 参数 值 4 所 取代 , 使 得 最 后 的 结果 为 5(20/4 )。 


3.4.2 RAER 


函数 重 载 (Overloaded ) 的 意思 是 ， 两 个 不 同 的 函数 可 以 用 同样 的 名 字 ， 只 要 它们 的 参量 
Carguments) 的 原型 (prototype) 不 同 。 也 就 是 说 ， 你 可 以 把 同一 个 名 字 给 多 个 函数 ， 如 果 它 们 用 
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不 同 数量 的 参数 或 不 同类 型 的 参数 。 
【 例 3.21】 函 数 重 载 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int divide(int a, int b) ( 
return (a / b); 


) 


float divide(float a, float b) ( 
return (a / b); 


) 


int main() ( 
int x e 5, y = 2; 
float n = 5.0, m = 2.0; 
cout << divide(x, y); 
cout «« "An"; 
cout << divide (n, m); 
cout «« "An"; 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[rootélocalhost test]# g++ test.cpp -o test 

[rootélocalhost test]# ./test 

2 

275 

在 这 个 例子 里 , 我 们 用 同一 个 名 字 定 义 了 两 个 不 同 的 函数 , 当 它 们 其 中 一 个 接收 两 个 整 型 (int) 
参数 时 ， 另 一 个 则 接收 两 个 浮 点 型 (float) 参数 。 编 译 器 (compiler) 通过 检查 传 入 的 参数 的 类 型 
来 确定 是 哪 一 个 函数 被 调用 。 如 果 调 用 传 入 的 是 两 个 整数 参数 ， 那 么 原型 定义 中 有 两 个 整 型 Cin 
参量 的 函数 被 调用 ， 如 果 传 入 的 是 两 个 浮 点 数 ， 那 么 原型 定义 中 有 两 个 浮 点 型 (float) 参量 的 函数 
被 调用 。 

为 了 简单 起 见 ， 这 里 我 们 用 的 两 个 函数 的 代码 相同 ， 但 这 并 不 是 必需 的 。 你 可 以 让 两 个 函数 
用 同一 个 名 字 同 时 完成 完全 不 同 的 操作 。 
3.4.8 ”内 联 函 数 

inline 指令 可 以 被 放 在 函数 声明 之 前 ,要 求 该 函数 必须 在 被 调用 的 地 方 以 代码 形式 被 编译 。 这 
相当 于 一 个 宏 定义 (macro) 。 它 的 好 处 是 只 对 短小 的 函数 有 效 ， 这 种 情况 下 ， 因 为 避免 了 调用 函 
数 的 一 些 常规 操作 的 时 间 Coverhead) ， 如 参数 堆栈 操作 的 时 间 , 所 以 编译 结果 的 运行 会 更 快 一 些 。 

它 的 声明 形式 是 : 
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inline type name ( arguments ... ) { instructions ... } 

内 联 函 数 的 调用 和 其 他 的 函数 调用 一 样 。 调 用 函数 的 时 候 并 不 需要 写 关键 字 inline, RAER 
数 声明 前 需要 写 。 
3.4.4 递归 


递归 Crecursivity) 指 函 数 将 被 自己 调用 。 它 对 排序 (sorting ) 和 阶乘 (factorial) 运算 很 有 用 。 
例如 ， 要 获得 一 个 数字 n 的 阶乘 ， 它 的 数学 公式 是 : 


nian nz2 NN Inza L 

更 具体 一 些 ，5! 是 : 

和 UE 2E TETI20 

用 一 个 递归 函数 来 实现 这 个 运算 的 代码 如 下 。 
【 例 3.22】 利 用 递归 计算 阶乘 

(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


long factorial(long a) ( 
if (a » 1) return (a * factorial(a - 1)); 
else return (1); 


) 
int main() ( 
long 1; 
cout << "Type a number: "; 
cin »» 1; 
cout << "!" << ] «« T = " << factorial(1)««endl; 


return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[rootélocalhost test]# ./test 

Type a number: 3 

!3 = 6 

注意 在 函数 factorial 中 是 怎样 调用 它 自己 的 , 但 只 是 在 参数 值 大 于 1 的 时 候 才 调 用 , 否则 函数 
会 进入 死 循环 (an infinite recursive loop) ， 当 参数 到 达 0 的 时 候 ， 函 数 不 继 续 用 负数 乘 下 去 ， 最 终 
可 能 导致 运行 时 的 堆栈 溢出 错误 (stack overflow error). 。 

这 个 函数 有 一 定 的 局 限 性 ， 为 了 简单 起 见 ， 函 数 设计 中 使 用 的 数据 类 型 为 长 整 型 (long) 。 在 
标准 系统 中 ， 长 整 型 无 法 存储 12! 以 上 的 阶乘 值 。 
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3.4.5 函数 的 声明 

到 目前 为 止 ， 我 们 定义 的 所 有 函数 都 是 在 它们 第 一 次 被 调用 (通常 是 在 main 中 ) 之 前 ， 而 把 
main 函数 放 在 最 后 。 如 果 重 复 前 面 几 个 例子 ， 但 把 main 函数 放 在 其 他 被 它 调用 的 函数 之 前 ， 就 
会 遇 到 编译 错误 。 原 因 是 在 调用 一 个 函数 之 前 ， 函 数 必须 已 经 被 定义 了 ， 就 像 我 们 前 面 的 例子 中 所 
做 的 。 

实际 上 还 有 一 种 方法 来 避免 在 main 或 其 他 函数 之 前 写 出 所 有 被 它们 调用 的 函数 的 代码 , 那 就 
是 在 使 用 前 先 声明 函数 的 原型 定义 。 声明 函 数 就 是 对 函数 完整 定义 之 前 做 一 个 短小 重要 的 声明 , 以 
便 让 编译 器 知道 函数 的 参数 和 返回 值 类 型。 

它 的 形式 是 : 

type name ( argument typel, argument type2, ...); 

它 与 一 个 函数 的 头 定义 Cheader definition) 一 样 ， 除 了 : 


€ 它 不 包括 函数 的 内 容 ， 也 就 是 不 包括 函数 后 面 花 括 号 “{}” 内 的 所 有 语句 。 
€ 它 以 一 个 分 号 “;” 结 束 。 


在 参数 列举 中 只 需要 写 出 各 个 参数 的 数据 类 型 就 够 了 ,至 于 每 个 参数 的 名 字 ， 可 以 写 , 也 可 以 
As, 但 是 建议 写 上 。 例 如 下 例 。 


【 例 3.23】 函 数 的 声明 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


void odd(int a); 
void even(int a); 


int main() ( 
int i; 
do ( 
cout << "Type a number: (0 to exit)"; 
cin >>- i; 
odd (i); 
} while (i != 0); 
return 0; 
} 


void odd(int a) { 
if ((a $ 2) != 0) cout << "Number is odd.\n"; 
else even(a); 

H 


void even(int a) ( 
if ((a $ 2) == 0) cout << "Number is even. An"; 
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else odd(a); 
) 


(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[rootQlocalhost test]# ./test 

Type a number: (0 to exit)5 

Number is odd. 

Type a number: (0 to exit)O 

Number is even. 

这 个 例子 的 确 不 是 很 有 效率 ,相信 现在 你 已 经 可 以 只 用 一 半 行 数 的 代码 来 完成 同样 的 功能 。 但 
这 个 例子 显示 了 函数 原型 (prototyping functions) 是 怎样 工作 的 。 并 且 在 这 个 例子 中 ， 两 个 函数 中 
至 少 有 一 个 是 必须 定义 原型 的 。 

这 里 首先 看 到 的 是 函数 odd 和 even 的 原型 : 


void odd (int a); 

void even (int a); 

这 样 使 得 这 两 个 函数 可 以 在 它们 被 完整 定义 之 前 就 被 使 用 ， 例 如 在 main 中 被 调用 ， 这 样 main 
就 可 以 被 放 在 逻辑 上 更 合理 的 位 置 : 程序 代码 的 开头 部 分 。 

尽管 如 此 ,这 个 程序 至 少 需要 一 个 函数 原型 定义 的 特殊 原因 是 ,在 odd 函数 里 需要 调用 even. R 
数 ， 而 在 even 函数 里 也 同样 需要 调用 odd 函数 。 如 果 两 个 函数 任何 一 个 都 没 被 提前 定义 原型 ， 就 
会 出 现 编译 错误 , 因为 要 么 odd 函数 在 even. 函数 中 是 不 可 见 的 (因为 它 还 没有 被 定义 ) ,要么 even 
函数 在 odd 函数 中 是 不 可 见 的 。 

很 多 程序 员 建议 给 所 有 的 函数 定义 原型 。 这 也 是 笔者 的 建议 ， 特 别 是 在 有 很 多 函数 或 函数 很 
长 的 情况 下 。 把 所 有 函数 的 原型 定义 放 在 一 个 地 方 , 可 以 使 我 们 在 决定 怎样 调用 这 些 函数 的 时 候 轻 
松 一 些 ， 同 时 也 有 助 于 生成 头 文件 。 


3.5 ”高 级 数据 类 型 


3.5.1 数组 


数组 (Arrays) 是 在 内 存 中 连续 存储 的 一 组 同 种 数据 类 型 的 元 素 〈 变 量 ) ， 每 一 个 数组 都 有 一 
个 唯一 的 名 称 ， 通 过 在 名 称 后 面 加 索引 〈index) 的 方式 可 以 引用 它 的 每 一 个 元 素 。 

也 就 是 说 ， 例 如 有 5 个 整 型 数值 需要 存储 ， 但 我 们 不 需要 定义 5 个 不 同 的 变量 名 称 ， 而 是 用 
一 个 数组 来 存储 这 5 个 不 同 的 数值 。 注 意 ， 数 组 中 的 元 素 必须 是 同一 数据 类 型 的 ,在 这 个 例子 中 为 
整 型 。 

例如 ， 一 个 存储 5 个 整数 ， 叫 作 billy 的 数组 可 以 用 图 3-4 来 表示 。 


* 134* 
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ccr 


图 3-4 


这 里 每 一 个 空白 框 代表 数组 的 一 个 元 素 , 在 这 个 例子 中 为 一 个 整数 值 。 空白 框 上 面 的 数字 0-4 
代表 元 素 的 索引 。 注 意 ， 无 论 数组 的 长 度 是 多 少 ， 它 的 第 一 个 元 素 的 索引 总 是 从 0 开始 的 。 

同 其 他 的 变量 一 样 ， 数组 必须 先 被 声明 然后 才能 被 使 用 。 一 种 典型 的 数组 声明 显示 如 下 : 

type name [elements]; 

这 里 type 可 以 是 任何 一 种 有 效 的 对 象 数据 类 型 Cobject type) ， 如 int、float $, name 是 一 个 
有 效 的 变量 标识 (identifier) ， 而 由 中 括号 (p 引起 来 的 elements 域 指明 数组 的 大 小 ， 即 可 以 存 
储 多 少 个 元 素 。 

因此 ， 要 定义 图 3-4 中 显示 的 billy 数组 ， 用 以 下 语句 就 可 以 了 : 

int billy [5]; 

注意 : 在 定义 一 个 数组 的 时 候 ， 中 括号 D 中 的 elements 域 必须 是 一 个 常量 数值 ， 因 为 数组 
是 内 存 中 一 块 有 固定 大 小 的 静态 空间 ,编译 器 必须 在 编译 所 有 相关 指令 之 前 能 够 确定 要 给 该 数组 分 
配 多 少 内 存 空间 。 

1. 初始 化 数组 

当 声 明 一 个 本 地 范围 内 在 一 个 函数 内 〉 的 数组 时 ， 除 非 我 们 特别 指定 ， 否 则 数组 将 不 会 被 
初始 化 ， 因 此 它 的 内 容 在 将 数值 存储 进去 之 前 是 不 定 的 。 

如 果 我 们 声明 一 个 全 局 数组 (在 所 有 函数 之 外 ) ， 它 的 内 容 将 被 初始 化 为 所 有 元 素 均 为 0。 因 
此 ， 如 果 全 局 范围 内 声明 : 

int DLLEY [517 


那么 billy 中 的 每 一 个 元 素 将 会 被 初始 化 为 0， 如 图 3-5 所 示 。 





0 1 2 3 4 
Simy — ol of ol ol ol 
图 3-5 


另外 ， 我 们 还 可 以 在 声明 一 个 变量 的 同时 把 初始 值 赋 给 数组 中 的 每 一 个 元 素 ， 这 个 赋值 用 花 
括号 ({ }) 来 完成 ， 例 如 : 


int billy [5] = { 16, 2, 77, 40, 12071 }; 
这 个 声明 生成 的 数组 如 图 3-6 所 示 。 
0 T 2 3 4 
billy 16 2 77 40 12071 
图 3-6 
EERS P 中 ， 我 们 要 初始 化 的 元 素数 值 个 数 必须 和 数组 声明 时 方 括号 (D 中 指定 的 数 
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组 长 度 相 符 。 例 如 ， 在 上 面 的 例子 中 ， 数 组 bily 声明 的 长 度 为 5， 因 此 在 后 面 的 花 括号 〈{}) 中 


的 初始 值 也 有 5 个 ， 每 个 元 素 一 个 数值 。 
因为 这 是 一 种 信息 的 重复 ， 所 以 C++ 允许 在 这 种 情况 下 数组 [ ] 中 为 空白 ， 而 数组 的 长 度 将 由 


后 面 花 括号 ({}) 中 数值 的 个 数 来 决定 ， 例 如 : 
int billy [] - ( 16, 2, 77, 40, 12071 Y; 


2. 存 取 数 组 中 的 数值 
在 程序 中 ， 我 们 可 以 读 取 和 修改 数组 任 一 元 素 的 数值 ， 就 像 操 作 其 他 普通 变量 一 样 。 格 式 如 


name [index] 
继续 上 面 的 例子 ， 数 组 bily 有 5 个 元 素 ， 其 中 每 一 个 元 素 都 是 整 型 的 ， 我 们 引用 其 中 每 一 个 
元 素 的 名 字 ， 分 别 如 图 3-7 所 示 。 


billy[0]  billy[1] billy[2]  billy[3]  billy[4] 
billy 





图 3-7 

例如 ， 要 把 数值 75 存 入 数组 bily 中 ， 第 3 个 元 素 的 语句 可 以 是 : 
billy[2] = 75; 
又 例如 ， 要 把 数组 billy 中 第 3 个 元 素 的 值 赋 给 变量 a， 可 以 这 样 写 
a = billy[2]; 
因此 ， 在 所 有 使 用 中 ， 表 达 式 billy[2] 就 像 任 何其 他 整 型 变量 一 样 。 

注意 ， 数 组 billy 的 第 3 个 元 素 为 billy[2]， 因 为 索引 从 0 开始 ， 第 1 个 元 素 是 billy[0]， 第 2 
个 元 素 是 billy[1]。 同 样 的 原因 ， 最 后 一 个 元 素 是 billy[4]。 如 果 我 们 写 billy[5]， 那 么 是 在 使 用 billy 
的 第 6 个 元 素 ， 因 此 会 超出 数组 的 长 度 。 

在 C++ 中 ， 对 数组 使 用 超出 范围 的 索引 是 合法 的 ， 这 就 会 产生 问题 ， 因 为 它 不 会 产生 编译 错 
误 而 不 易 被 察觉 , 但 是 在 运行 时 会 产生 意 想不到 的 结果 ,甚至 导致 严重 运行 错误 。 超出 范围 的 索引 
合法 的 原因 我 们 在 后 面 学 习 指 针 〈pointer〉 的 时 候 会 了 解 。 

学 到 这 里 , 我 们 必须 能 够 清楚 地 了 解 方 括号 ([]) 在 对 数组 操作 中 的 两 种 不 同 用 法 。 它 完成 两 
种 任务 : 一 种 是 在 声明 数组 的 时 候 定义 数组 的 长 度 ; 另 一 种 是 在 引用 具体 的 数组 元 素 的 时 候 指明 一 
个 索引 号 Gndex) 。 要 注意 不 要 把 这 两 种 用 法 混淆 。 

int billy[5]; // 声明 新 数组 (以 数据 类 型 名 称 开头 ) 

billy[2] = 75; // 存储 数组 的 一 个 元 素 

其 他 合法 的 数组 操作 : 


billy[0] = a; // a 为 一 个 整 型 变量 
billy[a] = 75; 
b = billy [a42]; 
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billy[billy[a]] = billy[2] + 5; 
【 例 3.24】 使 用 一 维 数组 
(OD 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


6 


Y 
P 


int billy[] = { 2, 77, 40, 12071 ); 


1 
int n, result 0 
int main() ( 

for (n2 0; n< 5; ntt) ( 

result += billy[n]; 

) 


cout << result««endl; 
return 0; 


1 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


12206[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
12206 


3. 多 维 数组 
多 维 数组 (Multidimensional Arrays) 本 质 上 是 以 数组 作为 数组 元 素 的 数组 , 即 “ 数 组 的 数组 ”。 


例如 ， 一 个 2 维 数 组 (Bidimensional Array) 可 以 被 想象 成 一 个 有 同一 数据 类 型 的 2 维 表格 ， 如 图 
3-8 所 示 。 











ol | | | 
d | | | | 











图 3-8 
jimmy 显示 了 一 个 整 型 (int ) 的 3X5 二 维 数组 ， 声 明 这 一 数组 的 方式 是 : 
int jimmy [3][5]; 
而 引用 这 一 数组 中 第 2 HESS 4 列 元 素 的 表达 式 为 : jimmy[1][3]， 如 图 3-9 所 示 。 


o 1 ? 3 4 
0 
e a | | 


2 | | 




















jimmy[1] [3] 





Linux C 与 C++ 一 线 开发 实践 





记 住 数组 的 索引 总 是 从 0 开始 的 。 

多 维 数组 并 不 局 限于 2 维 。 如 果 需 要 ， 它 可 以 有 任意 维 数 ， 虽 然 需 要 三 维 以 上 的 时 候 并 不 多 。 
但 是 考虑 一 下 一 个 有 很 多 维 的 数组 所 需要 的 内 存 空间 ， 例 如 : 

char century [100][365] [241 [60] [60]; 

给 一 个 世纪 中 的 每 一 秒 赋 一 个 字符 〈char) ， 就 是 多 于 30 亿 的 字符 。 如 果 我 们 定义 这 样 一 个 
数组 ， 需 要 消耗 3000MB 的 内 存 。 

多 维 数组 只 是 一 个 抽象 的 概念 ， 因 为 我 们 只 需要 把 各 个 索引 的 乘积 放 入 一 个 简单 的 数组 中 就 
可 以 获得 同样 的 结果 ， 例 如 : 


int jimmy [3] [5]; // 效 果 上 等 价 于 下 面 一 句 
int jimmy [15]; (3 * 5 = 15) 


唯一 的 区 别 是 编译 器 帮 我 们 记 住 每 一 个 想象 中 的 维度 的 深度 。 
【 例 3.25】 一 个 简单 的 多 维 数组 例子 
(1) 打开 UE， 输 入 代码 如 下 : 





#include <iostream> 
using namespace std; 


#define WIDTH 5 
#define HEIGHT 3 


int jimmy [HEIGHT] [WIDTH]; 
int n, m; 


int main() { 
for (n = 0; n < HEIGHT; n++) { 
for (m = 0; m < WIDTH; m++) 
t 
jimmy[n][m] - (n * 1)*(m * 1); 
cout << jimmy[n] [m] << ","; 
H 
cout «« endl; 
} 


return 0; 
} 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

1,2,3,4,5, 

2,4,6,8,10, 

3,6,9,12,15, 
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从 上 面 的 例子 中 可 以 看 到 ， 两 段 代 码 中 ， 一 个 使 用 2 维 数组 ， 另 一 个 使 用 简单 数组 ， 获 得 了 同 
样 的 结果 ， 即 都 在 内 存 中 开辟 了 一 块 叫 作 jimmy 的 空间 ， 这 个 空间 有 15 个 连续 地 址 位 置 ， 程 序 结 
束 后 都 在 相同 的 位 置 上 存储 了 相同 的 数值 ， 如 图 3-10 所 示 。 


LJ 1 -* 3 
0 ET 2 3 4 5 
jimmy 1 2 4 6 8 | 10 
? 3 6 9 12 15 
图 3-10 


我 们 用 了 安定 义 常 量 〈#define) 来 简化 未 来 可 能 出 现 的 程序 修改 ， 例 如 ， 决 定 将 数组 的 纵向 
由 3 扩大 到 4， 只 需要 将 代码 行 : 






































#define HEIGHT 3 

修改 为 : 
#define HEIGHT 4 

而 不 需要 对 程序 的 其 他 部 分 做 任何 修改 。 
4. 数组 参数 


有 时 候 ， 我 们 需要 将 数组 作为 参数 传 给 函数 。 在 C++ 中 ， 将 一 整 块 内 存 中 的 数值 作为 参数 完 
整地 传递 给 一 个 函数 是 不 可 能 的 ， 即使 是 一 个 规整 的 数组 也 不 可 能 , 但 是 允许 传递 它 的 地 址 。 它 们 
的 实际 作用 是 一 样 的 ， 但 传递 地 址 更 快速 有 效 。 

要 定义 数组 为 参数 ， 我 们 只 需要 在 声明 函数 的 时 候 指明 参数 数组 的 基本 数据 类 型 ， 一 个 标识 
后 面 再 跟 一 对 空中 括号 AD 就 可 以 了 。 例 如 以 下 的 函数 : 


void procedure (int arg[]) 
接收 一 个 叫 作 arg 的 整 型 数组 为 参数 。 为 了 给 这 个 函数 传递 一 个 按 如 下 定义 的 数组 : 
int myarray [40]; 
其 调用 方式 可 写 为 : 
procedure (myarray); 
下 面 我 们 来 看 一 个 完整 的 例子 。 


【 例 3.26】 把 数组 作为 参数 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


void printarray (int arg[], int length) { 


for (int n = 0; n < length; n++) { 
cout << arglnl se 
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) 
cout << "Xn"; 


int main() ( 
int firstarray[] = ( 5, 10, 15 ); 
int secondarray[] = ( 2, 4, 6, 8, 10 }; 
printarray(firstarray, 3); 
printarray(secondarray, 5); 
return 0; 


H 
(20. 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

S- T015 

2468 10 


可 以 看 到 ， 函 数 的 第 一 个 参数 Cintarg[ ]) 接收 任何 整 型 数组 为 参数 ， 不 管 其 长 度 如 何 。 因 此 ， 
我 们 用 了 第 2 个 参数 来 告知 函数 传 给 它 的 第 一 个 参数 数组 的 长 度 。 这 样 函数 中 打印 数组 内 容 的 for 
循环 才能 知道 需要 检查 的 数组 范围 。 

在 函数 的 声明 中 也 包含 多 维 数组 参数 。 定 义 一 个 三 维 数组 的 形式 是 : 

base type[ ] [depth] [depth] 

例如 ， 一 个 包含 多 维 数组 参数 的 函数 可 以 定义 为 : 

void procedure (int myarray[ ][3][4]) 

注意 ， 第 一 对 中 括号 (qp 中 为 空 ， 而 后 面 两 对 不 为 空 。 这 是 必需 的 ， 因 为 编译 器 必须 能 够 在 
函数 中 确定 每 一 个 增加 的 维度 的 深度 。 

数组 作为 函数 的 参数 ， 不 管 是 多 维 数组 还 是 简单 数组 ， 都 是 初级 程序 员 容 易 出 错 的 地 方 。 

5. 字符 数组 

字符 数组 也 叫 字 符 序 列 ， 字 符 数组 每 个 元 素 存放 的 是 字符 。 例 如 下 面 这 个 数组 : 


char jenny [20]; 


是 一 个 可 以 存储 最 多 20 个 字符 类 型 数据 的 数组 。 你 可 以 把 它 想象 成 如 图 3-11 所 示 的 样子 。 
jenny 


图 3-11 


理论 上 ， 这 个 数组 可 以 存储 长 度 为 20 的 字符 序列 ， 但 是 它 也 可 以 存储 更 短 的 字符 序列 ， 而 且 
实际 中 常常 如 此 。 例 如 ,jenny 在 程序 的 某 一 点 可 以 只 存储 字符 串 “Hello” 或 者 “Merry Christmas”。 
因此 ， 既 然 字 符 数组 经 常 被 用 于 存储 短 于 其 总 长 的 字符 串 , 就 形成 了 一 种 习惯 ,在 字符 串 的 有 效 内 
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容 的 结尾 处 加 一 个 空 字符 Cull character) 来 表示 字符 结束 ， 它 的 常量 表示 可 写 为 0 或 \0。 
我 们 可 以 用 图 3-12 表示 jenny. 〈 一 个 长 度 为 20 的 字符 数组 ) 存储 字符 串 “Hello” 和 “Merry 
Christmas”， 如 图 3-12 所 示 。 
jenny 
Mlelrir|y c[n[r[1[s]t [n[a[ s ho RR] 


图 3-12 





6. 初始 化 以 空 字 符 结束 的 字符 序列 
因为 字符 数组 其 实 就 是 普通 数组 ， 所 以 它 与 数组 遵守 同样 的 规则 。 例 如 ， 我 们 想 将 数组 初始 
化 为 指定 数值 ， 可 以 像 初始 化 其 他 数组 一 样 : 


char mystringil = {i "55 "eL; "In Mo NOn jg 


在 这 里 我 们 定义 了 一 个 有 6 个 元 素 的 字符 数组 ， 并 将 它 初始 化 为 字符 串 Helo 加 一 个 空 字符 
(800 。 

除 此 之 外 ， 字 符 串 还 有 另 一 个 方法 来 进行 初始 化 : 用 字符 串 常量 。 

在 前 几 章 的 例子 中 ， 字 符 串 常量 已 经 出 现 过 多 次 ， 它 们 是 由 双 引 号 引起 来 的 一 组 字符 来 表示 
的 ， 例 如 : 


"the result is: " 


是 一 个 字符 串 常量 ， 我 们 在 前 面 的 例子 中 已 经 使 用 过 。 

与 表示 单个 字符 常量 的 单 引号 O 不 同 ， 双 引号 〈") 用 于 表示 一 串 连 续 字 符 的 常量 。 由 双 引 
号 引起 来 的 字符 串 的 末尾 总 是 会 被 自动 加 上 一 个 空 字符 〈\0') 。 

因此 ， 我 们 可 以 用 下 面 两 种 方法 的 任何 一 种 来 初始 化 字符 串 mystring: 


char mystring [ ] 

char mystring [ ] 

在 两 种 情况 下 , 字符 串 或 数组 mystring 都 被 定义 为 6 个 字符 长 (元素 类 型 为 char) : 组 成 Hello 
的 5 个 字符 加 上 最 后 的 空 字符 〈"\0') 。 在 第 二 种 用 双 引 号 的 情况 下 ， 空 字符 (\0') 是 被 自动 加 上 
的 。 

注意 : 同时 给 数组 赋 多 个 值 只 有 在 数组 初始 化 时 ， 也 就 是 在 声明 数组 时 ， 才 是 合法 的 。 像 下 
面 的 代码 实现 的 表达 式 都 是 错误 的 : 


{ Mi Ur 'e', HUE pin oU "No" b; 
"Hello"; 


mystring = "Hello"; 

mystring[ ] = "Hello"; 

motelng = 

此 记 住 : 只 有 在 数组 初始 化 时 才能 够 同时 赋 多 个 值 给 它 。 其 原因 在 学 习 了 指针 (pointer) 之 
后 会 比较 容易 理解 ， 因 为 那 时 你 会 认识 到 一 个 数组 其 实 只 是 一 个 指向 被 分 配 的 内 存 块 的 常量 指针 
Cconstant pointer) ， 数 组 自己 不 能 够 被 赋予 任何 数值 ， 但 我 们 可 以 给 数组 中 的 每 一 个 元 素 赋值 。 
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7. 给 字符 序列 的 赋值 
因为 赋值 运算 的 lvalue 只 能 是 数组 的 一 个 元 素 ， 而 不 能 是 整个 数组 ， 所 以 用 以 下 方式 将 一 个 
字符 串 赋 给 一 个 字符 数组 是 合法 的 : 





mystring[0] = 'H'; 
mystring[1] = 'e'; 
mystring[2] = '1'; 
mystring[3] = '1'; 
mystring[4] = 'o'; 
mystring[5] = '\0'; 


但 正如 你 可 能 想到 的 ， 这 并 不 是 一 个 实用 的 方法 。 通 常 给 数组 赋值 ， 或 更 具体 些 ， 给 字符 序 
列 赋值 的 方法 是 使 用 一 些 函 数 ， 例 如 strcpy。strcpy (string copy) 在 函数 库 cstring (string.h) 中 被 
定义 ， 可 以 用 以 下 方式 被 调用 : 


strcpy (stringl, string2); 


这 个 函数 将 string2 中 的 内 容 找 贝 给 stringl 。string2 可 以 是 一 个 数组 、 一 个 指针 或 一 个 字符 串 
常量 (constant string) 。 因 此 ， 用 下 面 的 代码 可 以 将 字符 串 常量 Hello 赋 给 mystring: 


strcpy (mystring, "Hello"); 


[45) 3.27] strcpy 的 简单 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 

using namespace std; 

#include <string.h> 

int main() { 
char szMyName[20]; 
strcpy(szMyName, "J. Soulie"); 
cout << szMyName «« endl; 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 
J. Soulie 


我 们 需要 包括 头 文件 string.h 才能 够 使 用 函数 strcpy。 

通常 可 以 写 一 个 像 下 面 的 setstring 一 样 的 简单 程序 来 完成 与 上 例 中 stropy 同样 的 操作 : 
void setstring (char szOut [ ], char szIn [ ]) ( 

int n=0; 


do ( 
szOut[n] - szIn[n]; 
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) while (szIn[n++] != 'N0'); 
H 


int main () ( 

char szMyName [20]; 

setstring (szMyName,"J. Soulie"); 
cout << szMyName; 

return 0; 


) 

另 一 个 给 数组 赋值 的 常用 方法 是 直接 使 用 输入 流 Cin) 。 在 这 种 情况 下 ， 字 符 序列 的 值 是 在 
程序 运行 时 由 用 户 输入 的 。 

当 cin 被 用 来 输入 字符 序列 值 时 ， 它 通常 与 函数 getline 一 起 使 用 ， 方 法 如 下 : 


cin.getline ( char buffer[], int length, char delimiter = ' Mn'); 
这 里 buffer 用 来 存储 输入 的 地 址 〈 例 如 一 个 数组 名 ) length 是 缓存 buffer 的 最 大 容量 ， 而 
delimiter 是 用 来 判断 用 户 输入 结束 的 字符 , 它 的 默认 值 (如 果 我 们 不 写 这 个 参数 ) 是 换行 符 On 。 
下 面 的 例子 重复 输出 用 户 在 键盘 上 的 任何 输入 。 这 个 例子 简单 地 显示 了 如 何 使 用 cin.getline 来 
输入 字符 串 。 
【 例 3.28】 通 过 cin 输入 字符 数组 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main() ( 
char mybuffer[100]; 
cout «« "What's your name? "; 
cin.getline(mybuffer, 100); 
cout << "Hello " << mybuffer << ".An"; 
cout «« "Which is your favourite team? "; 
cin.getline(mybuffer, 100); 
cout << "I like " << mybuffer << " too. An"; 
return 0; 

i 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

What's your name? zww 

Hello zww. 

Which is your favourite team? cow 

I like cow too. 


注意 ， 上 面 的 例子 中 两 次 调用 cin.getline 时 ， 我 们 都 使 用 了 同一 个 字符 串 标识 (mybuffer) 。 
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程序 在 第 二 次 调用 时 ， 新 输入 的 内 容 将 直接 覆盖 第 一 次 输入 buffer 中 的 内 容 。 

你 可 能 还 记得 ， 在 以 前 与 控制 台 交 互 的 程序 中 ， 我 们 使 用 “>>” 符 号 直接 从 标准 输入 设备 接 
收 数据 。 这 个 方法 也 同样 可 以 被 用 来 输入 字符 串 , 例如 ， 在 上 面 的 例子 中 , 我 们 也 可 以 用 以 下 代码 
来 读 取 用 户 输入 : 


cin >> mybuffer; 
但 这 种 方法 有 以 下 局 限 性 是 cin.getline 所 没有 的 : 


d) 它 只 能 接收 单独 的 词 〈 而 不 能 是 完整 的 句子 ) ， 因 为 这 种 方法 以 任何 空白 符 为 分 隔 符 ， 
包括 空格 〈spaces) 、 跳 跃 符 Ctabulators) 、 换 行 符 (newlines) 和 回 车 符 Carriage returns) o 

(2) 它 不 能 给 buffer 指定 容量 ， 这 使 得 程序 不 稳定 ， 如 果 用 户 输入 超出 数组 长 度 ， 输 入 信息 
就 会 丢失 。 

因此 ， 建 议 在 需要 用 cin 来 输入 字符 串 时 ， 使 用 cin.getline KRE cin >>。 

8. 字符 串 和 其 他 数据 类 型 的 转换 

鉴于 字符 串 可 能 包含 其 他 数据 类 型 的 内 容 ， 例 如 数字 ， 将 字符 串 内 容 转换 成 数字 型 变量 的 功 
会 有 用 处 。 例 如 一 个 字符 串 的 内 容 可 能 是 "1977", 但 这 5 个 字符 组 成 的 序列 并 不 容易 转换 为 一 个 
单独 的 整数 。 因 此 ， 函 数 库 cstdlib (stdlib.h》 提 供 了 以 下 3 个 有 用 的 函数 。 


€ atoi: 将 字符 串 (sting) 转换 为 整 型 (int ) 。 
€ atol: 将 字符 串 (sting) 转换 为 长 整 型 (long) . 
€ atof: 将 字符 串 (string) 转换 为 浮 点 型 (float ) 。 


这 3 个 函数 接收 一 个 参数 ， 返 回 一 个 指定 类 型 的 数据 Cnt. long 或 foat) 。 这 3 个 函数 与 
cin.getline 一 起 使 用 来 获得 用 户 输 入 的 数值 ， 比 传统 的 cin>> 方法 更 可 靠 。 


【 例 3.29】 字 符 串 转 换 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
#include <stdlib.h> 


int main() { 
char mybuffer[100]; 
float price; 
int quantity; 
cout << "Enter price: "; 
cin.getline(mybuffer, 100); 
price - atof (mybuffer); 
cout «« "Enter quantity: "; 
cin.getline(mybuffer, 100); 
quantity = atoi (mybuffer); 
cout «« "Total price: " «« price*quantity; 
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return 0; 


} 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootQlocalhost test]# ./test 

Enter price: 5 

Enter quantity: 6 


9. C 函数 库 中 的 字符 串 操作 函数 

函数 库 〈string.h) 定义 了 许多 与 C 语言 类 似 的 处 理 字符 串 的 函数 〈 如 前 面 已 经 解释 过 的 函数 
strcpy) 。 这 里 再 简单 列举 一 些 常用 的 : 

strcat: char* strcat (char* dest, const char* src); // 将 字符 串 src 附加 到 字符 串 
dest 的 末尾 ， 返 回 qest 

strcmp: int strcmp (const char* stringl, const char* string2); // 比 较 两 个 字 
符 串 stringl 和 string2。 如 果 两 个 字符 串 相等 ， 返 回 0 

strcpy: char* strcpy (char* dest, const char* src); // 将 字符 串 src 的 内 容 拷贝 给 


dest， 返 回 dest 
strlen: size t strlen (const char* string); // 返 回 字符 串 的 长 度 


注意 : char* 与 char[] 相 同 。 


3.5.2 ”指针 

我 们 已 经 明白 变量 其 实 是 可 以 由 标识 来 存 取 的 内 存单 元 。 但 变量 实际 上 是 存储 在 内 存 中 具体 
的 位 置 上 的 。 对 程序 来 说 , 计算 机 内 存 只 是 一 串 连续 的 单字 节 单 元 (1byte cell)， 即 最 小 数据 单位 ， 
每 一 个 单元 有 一 个 唯一 地 址 。 

计算 机 内 存 就 好 像 城市 中 的 街道 。 在 一 条 街 上 ， 所 有 的 房子 被 顺序 编号 ， 每 所 房子 有 唯一 编 
号 。 因 此 ， 如 果 我 们 说 芝麻 街 27 号 ， 就 很 容易 找到 它 ， 因 为 只 有 一 所 房子 会 是 这 个 编号 ， 而 且 我 
们 知道 它 会 在 26 号 和 28 号 之 间 。 

与 房屋 按 街道 地 址 编号 一 样 ， 操 作 系 统 Coperating system). 也 按照 唯一 顺序 编号 来 组 织 内 存 。 
因此 ， 当 我 们 说 内 存 中 的 位 置 1776 时 ， 我 们 知道 内 存 中 只 有 一 个 位 置 是 这 个 地 址 ， 而 且 它 在 地 址 
1775 和 1777 之 间 。 


1. 地 址 操作 符 /去 引 操作 符 

在 声明 一 个 变量 的 同时 ， 它 必须 被 存储 到 内 存 中 一 个 具体 的 单元 中 。 通 常 我 们 并 不 会 指定 变 
量 被 存储 到 哪个 具体 的 单元 中 , 这 通常 是 由 编译 器 和 操作 系统 自动 完成 的 , 一 旦 操作 系统 指定 了 一 
个 地 址 ， 有 时 候 我 们 可 能 会 想 知道 变量 被 存储 在 哪里 。 

这 可 以 通过 在 变量 标识 前 面 加 与 符号 C&O 来 实现 ， 它 表示 “…… 的 地 址 ” (address of) ， 因 
此 称 为 地 址 操作 符 Caddress operator) ， 又 称 去 引 操作 符 (dereference operator) ， 例 如 : 





ted = &andy; 


将 变量 andy 的 地 址 赋 给 变量 ted， 当 在 变量 名 称 andy 前 面 加 人 符号 时 ， 我 们 指 的 将 不 再 是 该 





Linux C 与 C++ 一 线 开 发 实践 





变量 的 内 容 ， 而 是 它 在 内 存 中 的 地 址 。 
假设 andy 被 放 在 了 内 存 中 地 址 为 1776 的 单元 中 ， 有 下 列 代码 : 
andy = 25; 


fred = andy; 
ted = &andy; 


其 结果 显示 在 图 3-13 中 。 








andy 
| | 2s] | 
1775 1776 — i777 
x N 
fred ted 
25 | 1776] 
图 3-13 


我 们 将 变量 andy 的 值 赋 给 变量 fred， 这 与 以 前 看 到 的 很 多 例子 都 相同 ， 但 对 于 ted, RHE 
操作 系统 存储 andy 的 内 存 地 址 赋 给 它 ， 想 象 该 地 址 为 1776〈 可 以 是 任何 地 址 ， 这 里 只 是 一 个 假设 
的 地 址 ) ， 原 因 是 当 给 ted 赋值 的 时 候 ， 我 们 在 andy 前 面 加 了 & 符 号 。 

存储 其 他 变量 地 址 的 变量 (如 上 面 例子 中 的 ted) 称 为 指针 (pointe 。 在 C++ 中 ， 指 针 有 其 
特定 的 优点 ， 因 此 经 常 被 使 用 。 在 后 面 我 们 将 会 看 到 这 种 变量 如 何 被 声明 。 

2. 引用 操作 符 

使 用 指针 的 时 候 ， 我 们 可 以 通过 在 指针 标识 的 前 面 加 星 号 CO 来 存储 该 指针 指向 的 变量 所 存 
储 的 数值 ， 它 可 以 被 翻译 为 “所 指向 的 数值 ” (value pointed by) 。 因 此 ， 仍 用 前 面 例 子 中 的 数值 ， 
WRI: beth = *ted; GFE: beth 等 于 ted 所 指向 的 数值 ) ，beth 将 会 获得 数值 23， 因 为 ted 是 
1776， 而 1776 所 指向 的 数值 为 25， 如 图 3-14 所 示 。 


(memory) 











图 3-14 


你 必须 清楚 地 区 分 ted 存储 的 是 1776， 但 *ted〈 前 面 加 *) 指 的 是 地 址 1776 中 存储 的 数值 ， 
即 25。 注意 ， 加 或 不 加 星 号 (*) 的 不 同 〈 下 面 代码 中 的 注释 显示 了 如 何 读 这 两 个 不 同 的 表达 式 ) ; 


ted; // beth 等 于 ted ( 1776 ) 
*ted; // beth 等 于 ted 所 指向 的 数值 ( 25 ) 


beth 
beth 


.146 。 
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3. 地 址 或 反 引 用 操作 符 
地 址 或 反 引 用 操作 符 被 用 作 一 个 变量 前 级， 可 以 被 翻译 为 “…… 的 地 址 ”， 因 此 ，&variablel 


可 以 被 读 作 variablel 的 地 址 (address of variablel) 。 


4. 引用 操作 符 
引用 操作 符 表 示 要 取 的 是 表达 式 所 表示 的 地 址 指向 的 内 容 ， 可 以 被 翻译 为 “…… 指 向 的 数值 


Cvalue pointed by) 。 


引用 
达 式 


* mypointer 可 以 被 读 作 “mypointer 指向 的 数值 ”。 
继续 使 用 上 面 的 例子 ， 看 下 面 的 代码 : 


andy = 25; 
ted = &andy; 


现在 你 应 该 可 以 清楚 地 看 到 以 下 等 式 全 部 成 立 : 


andy == 25 
&andy == 1776 
ted == 1776 
*ted == 25 


第 一 个 表达 式 很 容易 理解 ， 因 为 我 们 有 赋值 语句 andy=25;。 第 二 个 表达 式 使 用 了 地 址 〈 或 反 
) 操作 符 〈&) 来 返回 变量 andy 的 地 址 ， 即 1776。 第 三 个 表达 式 很 明显 成 立 ， 因 为 第 二 个 表 
为 真 ， 而 我 们 给 ted 赋值 的 语句 为 ted = &andy;。 第 四 个 表达 式 使 用 了 引用 操作 符 (*) ， 相 当 


T ted 指向 的 地 址 中 存储 的 数值 ， 即 25。 


类 型 
不 相 


同样 


由 此 你 也 可 以 推断 出 ， 只 要 ted 所 指向 的 地 址 中 存储 的 数值 不 变 ， 以 下 表达 式 也 为 真 : 


*ted == andy 


5. 声明 指针 型 变量 
由 于 指针 可 以 直接 引用 它 所 指向 的 数值 ， 因 此 有 必要 在 声明 指针 的 时 候 指明 它 所 指向 的 数据 
。 指 向 一 个 整 型 (int) 或 浮 点 型 Cfloat) 数据 的 指针 与 指向 一 个 字符 型 《char) 数据 的 指针 并 
同 。 

因此 ， 声 明 指针 的 格式 如 下 ; 





type * pointer name; 
这 里 ，type 是 指针 所 指向 的 数据 的 类 型 ， 而 不 是 指针 自己 的 类 型 ， 例 如 : 


int * number; 
char * character; 
float * greatnumber; 


它们 是 3 个 指针 的 声明 , 每 一 个 指针 指向 不 同 的 数据 类 型 。 这 3 个 指针 本 身 其 实在 内 存 中 占用 
大 小 的 内 存 空 间 (指针 的 大 小 取决 于 不 同 的 操作 系统 ) ， 但 它们 所 指向 的 数据 是 不 同 的 类 型 ， 
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占用 不 同 大 小 的 内 存 空 间 , 一 个 是 整 型 Gnt), 一 个 是 字符 型 (char), 还 有 一 个 是 浮 点 型 (float) o 
需要 强调 的 一 点 是 ， 在 声明 指针 时 ， 星 号 CO 仅 表 示 这 里 声明 的 是 一 个 指针 ， 不 要 把 它 和 前 

面 用 过 的 引用 操作 符 混淆 ， 虽 然 那 也 写成 一 个 星 号 C) 。 它 们 只 是 用 同一 符号 表示 的 两 个 不 同 任 

务 。 

【 例 3.30】 第 一 个 指针 例子 

(1) 打开 UE， 输 入 代码 如 下 : 








#include <iostream> 
using namespace std; 


int main() ( 
int valuel - 5, value2 - 15; 
int * mypointer; 
mypointer - &valuel; 
*mypointer - 10; 
mypointer - &value2; 
*mypointer = 20; 
cout «« "valuel--" «« valuel «« "/ value2--" «« value2; 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

valuel==10/ value2==20 

注意 变量 valuel 和 value2 是 怎样 间接 地 被 改变 数值 的 。 首 先 使 用 & 将 valuel 的 地 址 赋 给 
mypointer。 然 后 将 10 WA mypointer 所 指向 的 数值 ， 它 其 实 指 向 valuel 的 地 址 ， 因 此 ， 我 们 间接 
地 修改 了 valuel 的 数值 。 

为 了 让 你 了 解 在 同一 个 程序 中 一 个 指针 可 以 被 用 作 不 同 的 数值 ， 我 们 在 这 个 程序 中 用 value2 
和 同一 个 指针 重复 了 上 面 的 过 程 。 下 面 是 一 个 更 复杂 的 例子 。 


[513.31] 更 复杂 的 指针 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main() ( 
int valuel = 5, value2 = 15; 
ine pl *p2} 


pl = &valuel; // pl = address of valuel 

p2 = &value2; // p2 = address of value2 

*pl = 10; // value pointed by pl = 10 

*p2 = *pl; // value pointed by p2 = value pointed by pl 
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pl = p2; // pl = p2 (value of pointer copied) 

*pl = 20; // value pointed by pl = 20 

cout «« "valuel--" «« valuel «« "/ value2--" «« value2««endl; 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

valuel--10/ value2==20 

上 面 每 一 行 都 有 注释 说 明代 码 的 意思 : & 为 “address of”，* 为 “value pointed by”。 注 意 ， 
有 些 包含 pl 和 p2 的 表达 式 不 带 星 号 。 加 不 加 星 号 的 含义 十 分 不 同 : 星 号 〈*) 后 面 跟 指 针 名 称 表 
示 指 针 所 指向 的 地 方 ， 而 指针 名 称 不 加 星 号 (*) 表示 指针 本 身 的 数值 ， 即 它 所 指向 的 地 方 的 地 址 。 

另 一 个 需要 注意 的 地 方 是 这 一 行 : 

int *pl, *p2; 

声明 了 上 例 用 到 的 两 个 指针 ， 每 个 带 一 个 星 号 (*) ， 因 为 是 这 一 行 定义 的 所 有 指针 都 是 整 型 
(int， 而 不 是 int*) 的 。 原 因 是 引用 操作 符 (*) 的 优先 级 顺序 与 类 型 声明 的 相同 ， 因 此 ， 它 们 都 
是 向 右 结合 的 操作 ， 星 号 被 优先 计算 。 注 意 ， 在 声明 每 一 个 指针 的 时 候 ， 前 面 加 上 星 号 CO. 

6. 指针 和 数组 

数组 的 概念 与 指针 的 概念 联系 非常 解密 。 其 实数 组 的 标识 相当 于 它 的 第 一 个 元 素 的 地 址 ， 就 
像 一 个 指针 相当 于 它 所 指向 的 第 一 个 元 素 的 地 址 ,因此 其 实 它们 是 同一 个 东西 。 例 如 ， 假 设 有 以 下 
声明 ; 

int numbers [20]; 

Tnt ^ D 

下 面 的 赋值 为 合法 的 : 

p = numbers; 

这 里 指针 p 和 numbers 是 等 价 的 ， 它 们 有 相同 的 属性 ， 唯 一 的 不 同 是 我 们 可 以 给 指针 p 赋 其 
他 的 数值 ， 而 numbers 总 是 指向 被 定义 的 20 个 整数 组 中 的 第 一 个 。 所 以 ，p 只 是 一 个 普通 的 指针 
变量 ， 而 与 之 不 同 的 是 ，numbers 是 一 个 数组 名 ， 数 组 名 的 本 质 是 一 个 指针 常量 。 因 此 ， 虽 然 前 面 
的 赋值 表达 式 是 合法 的 ， 但 下 面 的 不 是 : 


numbers = p; 
因为 numbers 是 一 个 数组 (指针 常量 ) ， 所 以 常量 标识 不 可 以 被 赋 其 他 数值 。 
由 于 变量 的 特性 ， 以 下 例子 中 所 有 包含 指针 的 表达 式 都 是 合法 的 。 
【 例 3.32】 指 向 数组 的 指针 
(1) 打开 UE， 输 入 代码 如 下 : 
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#include <iostream> 
using namespace std; 
int main() ( 

int numbers[5]; 


dnt * pr 

p » numbers; 

ier — 10% 

ptt; 

*p = 20; 

p = &numbers[2]; 
*p = 30; 

p = numbers + 3; 
xp = 40; 


p = numbers; 

*(p + 4) = 50; 

for (int n= 0; n < 5; mk) 
cout «« numbers[n] «« ", "; 

cout «« endl; 

return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
10, 20, 30, 40, 50, 


在 3.5.1 节 中 ， 我 们 使 用 中 括号 (D 来 指明 要 引用 的 数组 元 素 的 索引 (index) 。 中 括号 (D 
也 叫 位 移 〈offset) 操作 符 ， 它 相当 于 在 指针 中 的 地 址 上 加 上 括号 中 的 数字 。 例 如 ， 下 面 两 个 表达 
式 互 相等 价 : 


a[5] = 0; // a [offset of 5] = 0 
*(a*5) = 0; // pointed by (a*5) = 0 


无 论 a 是 一 个 指针 还 是 一 个 数组 名 ， 这 两 个 表达 式 都 是 合法 的 。 
7. 指针 初始 化 
当 声 明 一 个 指针 的 时 候 ， 我 们 可 能 需要 同时 指定 它们 指向 哪个 变量 。 


int number; 
int *tommy = &number; 


这 相当 于 : 
int number; 


int *tommy; 
tommy = &number; 


当 给 一 个 指针 赋值 的 时 候 ， 我 们 总 是 赋 给 它 一 个 地 址 值 ， 而 不 是 它 所 指向 数据 的 值 。 你 必须 
考虑 到 在 声明 一 个 指针 的 时 候 ， 星 号 (*) 只 是 用 来 指明 它 是 指针 ， 而 从 不 表示 引用 操作 符 (*) 。 
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记 住 ， 它 们 是 两 种 不 同 操作 ， 虽 然 它们 写成 同样 的 符号 。 因 此 ， 我 们 要 注意 不 要 将 以 上 代码 与 下 面 
的 代码 混淆 : 

int number; 

int *tommy; 

*tommy = &number; 

这 些 代码 也 没有 什么 实际 意义 。 

在 定义 数组 指针 的 时 候 ， 编 译 器 允许 我 们 在 声明 变量 指针 的 同时 对 数组 进行 初始 化 ， 初 始 化 
的 内 容 需 要 是 常量 ， 例 如 : 


char * terry - "hello"; 


在 这 个 例子 中 ， 内 存 中 预 留 了 存储 “hello” 的 空间 ， 并 且 terry 是 指向 这 个 内 存 空 间 第 一 个 字 
符 (对 应 “h”) 的 指针 。 假 设 “hello” 存 储 在 地 址 1702 中 ， 图 3-15 显示 了 上 面 的 定义 在 内 存 中 
的 状态 。 





图 3-15 


这 里 需要 强调 ，terry 存储 的 是 数值 1702， 而 不 是 “h” 或 “hello”， 虽 然 1702 指向 这 些 字符 。 

指针 terry 指向 一 个 字符 串 ， 可 以 被 当 作 数 组 一 样 使 用 〈 数 组 只 是 一 个 常量 指针 ) 。 例 如 ， 我 
们 想 把 terry 指向 的 内 容 中 的 字符 “o” 变 为 符号 “!”， 可 以 用 以 下 两 种 方式 的 任何 一 种 来 实现 : 

terry[4] = '!'; 

*(terry+4) = '!'; 

记 住 写 terry[4] 与 *(terry+4) 是 一 样 的 ， 虽 然 第 一 种 表达 方式 更 常用 一 些 。 以 上 两 种 表达 式 都 
会 实现 如 图 3-16 所 示 的 改变 。 


Lhe [ xen | v | xe enge No 





3-16 


8. 指针 的 数学 运算 
对 指针 进行 数学 运算 与 其 他 整 型 数据 类 型 进行 数学 运算 稍 有 不 同 。 首 先 ， 对 指针 只 有 加 法 和 
减法 运算 , 其 他 运算 在 指针 世界 里 没有 意义 。 但 是 指针 的 加 法 和 减法 的 具体 运算 根据 它 所 指向 的 数 


»1ib51'e 
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据 类 型 大 小 的 不 同 而 有 所 不 同 。 
我 们 知道 不 同 的 数据 类 型 在 内 存 中 占用 的 存储 空间 是 不 一 样 的 。 例 如 ， 对 于 整 型 数据 ， 字 符 
Cchar) 占用 1 字 节 (1 byte) ， 短 整 型 (short) 占用 2 字 节 ， 长 整 型 (long) 占用 4 字 节 。 
假设 有 3 个 指针 : 


char *mychar; 
short *myshort; 
long *mylong; 


而 且 我 们 知道 它们 分 别 指向 内 存 地 址 1000. 2000 和 3000。 因 此 ， 如 果 有 以 下 代码 : 


mychartt; 
myshorttt; 
mylongtt; 


就 像 你 可 能 想到 的 ，mychar 的 值 将 会 变 为 1001。 而 myshort 的 值 将 会 变 为 2002，mylong 的 
值 将 会 变 为 3004。 原 因 是 当 我 们 给 指针 加 1 时， 实际 上 是 让 该 指针 指向 下 一 个 与 它 被 定义 的 数据 
类 型 相同 的 元 素 。 因 此 ， 它 所 指向 的 数据 类 型 的 长 度 字 节 数 将 会 被 加 到 指针 的 数值 上 。 以 上 过 程 可 
以 由 图 3-17 表示 。 

1000 1001 


-一 一 
mychar—| 十 十 


2000 2001 2002 2003 


= 
myshort N } ++ 


3000 3001 3002 3003 3004 3005 3006 3007 


一 
mylong mmm TEM jj 十 十 
B 3-17 
这 一 点 对 指针 的 加 法 和 减法 运算 都 适用 。 以 下 代码 与 上 面 例子 的 作用 一 样 ; 


mychar = mychar + 1; 

myshort = myshort + 1; 

mylong - mylong * 1; 

这 里 需要 提醒 的 是 ， 递 增 Ce) 和 递减 〈--) 操作 符 比 引用 操作 符 (*) 有 更 高 的 优先 级 ， 因 
此 ， 以 下 表达 式 有 可 能 引起 歧义 : 


*ptt; 
Spri = taty 
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第 一 个 表达 式 等 同 于 *(p++) ， 它 的 作用 是 指针 p 本 身 的 地 址 值 递增 一 次 Cp 中 存储 的 是 地 址 ， 


递增 一 次 后 ， 变 为 新 的 地 址 ) 。 


前 ， 


在 第 二 个 表达 式 中 ， 因 为 两 个 递增 操作 〈++) 都 是 在 整个 表达 式 被 计算 之 后 进行 而 不 是 在 之 
所 以 *q 的 值 首先 被 赋予 *p ， 然 后 q fp 都 增加 1。 它 相当 于 : 

aoia ei 

ptt; 

qtt; 


建议 使 用 括号 “0” 以 避免 意 想不到 的 结果 。 
9. 指针 的 指针 
C++ 人 允许 使 用 指向 指针 的 指针 。 要 做 到 这 一 点 ， 我 们 只 需要 在 每 一 层 引 用 之 前 加 星 号 (*) 即 


char a; 

char * b; 
char ** o} 
a 
b 
c 


假设 随机 选择 内 存 地 址 为 7230、8092 和 10502， 以 上 例子 可 以 用 图 3-18 表示 。 


'z'; 
&a; 
&b; 


a b € 


Le Jaen j oe | 
7230 8092 10502 
图 3-18 


图 3-18 中 方 框 内 为 变量 的 内 容 ， 方 框 下 面 为 内 存 地 址 。 

这 个 例子 中 新 的 元 素 是 变量 c， 关 于 它 可 以 从 3 个 方面 来 讨论 ， 每 一 个 方面 对 应 不 同 的 数值 : 
€ c 是 一 个 (char **) 类 型 的 变量 ， 它 的 值 是 8092。 

€ *c 是 一 个 (char*) 类 型 的 变量 ， 它 的 值 是 7230。 

€ **c 是 一 个 (chan) 类 型 的 变量 ， 它 的 值 是 zz。 

10. 空 指针 

指针 void 是 一 种 特殊 类 型 的 指针 。 void 指针 可 以 指向 任意 类 型 的 数据 , 可 以 是 整数 、 浮 点 数 ， 


甚至 是 字符 串 。 唯 一 一 个 限制 是 被 指向 的 数值 不 可 以 被 直接 引用 〈 不 可 以 直接 对 空 指针 使 用 星 号 
“*”) ， 因 为 它 的 长 度 是 不 定 的 ， 因 此 必须 使 用 类 型 转换 操作 或 赋值 操作 来 把 void 指针 指向 一 
个 具体 的 数据 类 型 。 














空 指针 的 应 用 之 一 是 被 用 来 给 函数 传递 通用 参数 。 


【 例 3.33】 空 指针 实例 


(1) 打开 UE， 输 入 代码 如 下 : 
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#include <iostream> 

using namespace std; 

void increase (void* data, int 
switch (type) { 
case sizeof (char) 
case sizeof (short): 
case sizeof (long) 


} 


int main() { 

char a 5; 

short b = 9; 

long c 12; 
increase(&a, sizeof(a)); 
increase(&b, sizeof (b)); 
increase(&c, sizeof (c)); 
cout << (int) a << ", 
return 0; 


) 


(* ((char*)data))-**; 
(*((short*)data))-**; break; 
(*((1ong*)data))-**; break; 


Sep ae 


type) { 


break; 


" << c<<endl; 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 


[root@localhost test]# ./test 
oe 


sizeof 是 C++ 的 一 个 操作 符 ， 用 来 返 





回 其 参数 的 长 度 字 节 数 常量 。 例 如 ，sizeoftchar) 返回 1, 


因为 char 类 型 是 1 字 节 长 的 数据 类 型 。 另 外 ,我 们 可 以 看 到 data 转换 为 (char*) 后 ,才能 使 用 星 号 


来 引用 。 
11. 函数 指针 


C++ 允许 对 指向 函数 的 指针 进行 操作 。 它 最 大 的 作用 是 把 一 个 函数 作为 参数 传递 给 另 一 个 函 
数 。 声明 一 个 函数 指针 像 声 明 一 个 函数 原型 一 样 , 除了 函数 的 名 字 需 要 被 括 在 括号 内 并 在 前 面 加 星 


Hey s 
[41 3.34] Eds ERST 
CD 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 

using namespace std; 

int addition(int a, int b) { 
return (a + b); 

l 


int subtraction(int a, int b) 


return (a - b); 
H 


t 
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int (*myf) (int, int) = subtraction; 


int operation (int x, int y, int(*functocall) (int, int)) { 
int g; 
g = (*functocall) (x, y); 
return (g); 


int main() { 
dnt m, n; 
m = operation(7, 5, addition); 
n = operation(20, m, myf); 
cout «« n «« endl; 
return 0; 


) 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

8 

在 这 个 例子 里 ，minus 是 一 个 全 局 指针 ， 指 向 一 个 有 两 个 整 型 参数 的 函数 ， 它 被 赋值 指向 函 
数 subtraction， 这 些 由 一 行 代码 实现 : 

int (* minus) (int,int) = subtraction; 

这 里 似乎 解释 得 不 太 清楚 ， 你 可 能 会 问 为 什么 (int inb 只 有 类 型 ， 没 有 参数 ， 下 面 就 再 多 说 两 句 。 

这 里 int (*minus)(int inb 实 际 是 在 定义 一 个 指针 变量 , 这 个 指针 的 名 字 叫 作 minus, 这 个 指针 的 
类 型 指向 一 个 函数 ， 函 数 的 类 型 有 两 个 整 型 参数 并 返回 一 个 整 型 值 。 

整 句 话 “int (*minus)(int,int) = subtraction;” 定 义 了 这 样 一 个 指针 并 把 函数 subtraction 的 值 赋 给 
它 ， 也 就 是 说 有 了 这 个 定义 后 ，minus 就 代表 函数 subtraction。 因 此 ， 括 号 中 的 两 个 int 实际 上 只 是 
一 种 变量 类 型 的 声明 ， 也 就 是 说 是 一 种 形式 参数 ， 而 不 是 实际 参数 。 
3.5.8 ”动态 分 配 内 存 

到 目前 为 止 ， 我 们 的 程序 中 只 用 了 声明 变量 、 数 组 和 其 他 对 象 Cobjects). 所 必需 的 内 存 空间 ， 
这 些 内 存 空 间 的 大 小 都 在 程序 执行 之 前 就 已 经 确定 了 。 但 如 果 我 们 需要 内 存 大 小 为 一 个 变量 , 其 数 
值 只 有 在 程序 运行 时 (runtime) 才能 确定 ， 例 如 有 些 情 况 下 需要 根据 用 户 输入 来 决定 必需 的 内 存 
空间 ， 那 么 该 怎么 办 呢 ? 

答案 是 动态 分 配 内 存 (dynamic memory) ， 为 此 C++ 集成 了 操作 符 new 和 deletes 

1. 操作 符 new 和 new[] 

操作 符 new 的 作用 是 动态 分 配 内 存 。 new 后 面 跟 一 个 数据 类 型 , 并 跟 一 对 可 选 的 方 括号 ([])， 
里 面 为 要 求 的 元 素数 。 它 返回 一 个 指向 内 存 块 开始 位 置 的 指针 。 其 形式 为 : 


pointer = new type 
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或 者 
pointer = new type [elements] 


第 一 个 表达 式 用 来 给 一 个 单元 素 的 数据 类 型 分 配 内 存 。 第 二 个 表达 式 用 来 给 一 个 数组 分 配 内 存 。 

例如 : 

int * bobby; 

bobby = new int [5]; 

在 这 个 例子 里 ， 操 作 系统 分 配 了 可 存储 5 个 整 型 (int) 元 素 的 内 存 空间 ， 返 回 指向 这 块 空间 
开始 位 置 的 指针 并 将 它 赋 给 bobby. 因此 , 现在 bobby 指向 一 块 可 存储 5 个 整 型 元 素 的 合法 的 内 存 
空间 ， 如 图 3-19 所 示 。 





int 


Bri sam peer] pua 


bobby 


图 3-19 


你 可 能 会 问 刚才 所 做 的 给 指针 分 配 内 存 空间 与 定义 一 个 普通 的 数组 有 什么 不 同 。 最 重要 的 不 
同 是 , 数组 的 长 度 必 须 是 一 个 常量 , 这 样 它 的 大 小 在 程序 执行 之 前 的 设计 阶段 就 被 决定 了 。 而 采用 
动态 内 存 分 配 ， 数 组 的 长 度 可 以 常量 或 变量 ， 其 值 可 以 在 程序 执行 过 程 中 再 确定 。 

动态 内 存 分 配 通常 由 操作 系统 控制 ， 在 多 任务 的 环境 中 ， 它 可 以 被 多 个 应 用 Capplications) Jt 
享 ， 因 此 内 存 有 可 能 被 用 完 。 如 果 这 种 情况 发 生 ， 操 作 系统 将 不 能 在 遇 到 操作 符 new 时 分 配 所 需 
的 内 存 ， 一 个 无 效 指针 Cull pointer) 将 被 返回 。 因 此 ， 建 议 在 使 用 new 之 后 总 是 检查 返回 的 指针 
是 否 为 空 (null) ， 如 下 例 所 示 : 


int * bobby; 

bobby = new int [5]; 

if (bobby == NULL) { 

// error assigning memory. Take measures. 
] 

2. 删除 操作 符 delete 


既然 动态 分 配 的 内 存 只 是 在 程序 运行 的 某 一 具体 阶段 才 有 用 ， 那 么 一 旦 它 不 再 被 需要 时 就 应 
该 被 释放 ， 以 便 给 后 面 的 内 存 申 请 使 用 。 操 作 符 delete 因此 而 产生 ， 它 的 形式 是 : 








delete pointer; 
或 
delete [ ] pointer; 


第 一 种 表达 形式 用 来 删除 给 单个 元 素 分 配 的 内 存 ， 第 二 种 表达 形式 用 来 删除 多 元 素 (数组) 的 
VEA) BO. 在 多 数 编译 器 中 两 种 表达 式 等 价 ,使 用 没有 区 别 ， 虽然 它们 实际 上 是 两 种 不 同 的 操作 ， 


* 156* 
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需要 考虑 操作 符 重 载 (overloading) 。 
【 例 3.35】delete[] 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
finclude <stdlib.h> 


int main() ( 
char input[100]; 
int i, n; 
long * 1; 
cout << "How many numbers do you want to type in? "; 
cin.getline(input, 100); i - atoi(input); 
1 = new long[i]; 
if (l == NULL) exit (1); 
for (n = 0; n < i; n++) ( 
cout << "Enter number: "; 
cin.getline(input, 100); 
l[n] = atol(input); 
) 
cout «« "You have entered: "; 
for (n = 0; n < i; n++) 
COUE << Ifin] s< mm 
delete[] 1; 
return 0; 


) 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


How many numbers do you want to type in? 2 

Enter number: 1 

Enter number: 3 

You have entered: 1, 3, 

这 个 简单 的 例子 可 以 记 下 用 户 想 输入 的 任意 多 个 数字 , 它 的 实现 归功 于 我 们 动态 地 向 系统 申请 
用 户 要 输入 的 数字 所 需 的 空间 。 

NULL 是 C++ 库 中 定义 的 一 个 常量 ， 专 门 设计 用 来 指 代 空 指针 的 。 如 果 这 个 常量 没有 被 预先 
定义 ， 你 可 以 自己 定 以 它 为 0: 


#define NULL 0 


在 检查 指针 的 时 候 ，0 和 NULL 并 没有 区 别 。 但 用 NULL. 来 表示 空 指针 更 为 常用 ， 并 且 更 易 


懂 。 原 因 是 指针 很 少 被 用 来 比较 大 小 或 被 直接 赋予 一 个 除 0 以 外 的 数字 常量 , 使 用 NULL, 这 一 赋 
值 行为 就 被 符号 化 了 。 
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3. ANSI-C 中 的 动态 内 存 管理 

操作 符 new 和 delete 仅 在 C++ 中 有 效 ， 而 在 C 语言 中 没有 效 。 在 C 语言 中 ， 为 了 动态 分 配 
内 存 ， 我 们 必须 求助 于 函数 库 stdlib.h。 因 为 该 函数 库 在 C++ 中 仍然 有 效 ， 并 且 在 一 些 现存 的 程序 
中 仍然 使 用 ， 所 以 下 面 将 学 习 一 些 关 于 这 个 函数 库 中 的 函数 的 用 法 。 

(1) 函数 malloc 

这 是 给 指针 动态 分 配 内 存 的 通用 函数 。 它 的 原型 是 : 


void * malloc (size t nbytes); 


其 中 ，nbytes 是 我 们 想 要 给 指针 分 配 的 内 存 字 节 数 。 这 个 函数 返回 一 个 void* 类 型 的 指针 ， 因 
此 需要 用 类 型 转换 (type cast) 来 把 它 转换 成 目标 指针 所 需要 的 数据 类 型 ， 例 如 : 


char * ronny; 
ronny = (char *) malloc (10); 


这 个 例子 将 一 个 指向 10 个 字 节 可 用 空间 的 指针 赋 给 ronny。 当 我 们 想 给 一 组 除 char. 以 外 的 类 
型 (不 是 1 字 节 长 度 的 ) 的 数值 分 配 内 存 的 时 候 , 我 们 需要 用 元 素数 乘 以 每 个 元 素 的 长 度 来 确定 所 
需 内 存 的 大 小 。 幸 运 的 是 ， 我 们 有 操作 符 sizeof， 它 可 以 返回 一 个 具体 数据 类 型 的 长 度 。 


int * bobby; 
bobby = (int *) malloc (5 * sizeof(int)); 


这 一 小 段 代 码 将 一 个 指向 可 存储 5 个 int 型 整数 的 内 存 块 的 指针 赋 给 bobby， 它 的 实际 长 度 可 
能 是 2、4 或 更 多 字 节 数 ， 取 决 于 程序 是 在 什么 操作 系统 下 被 编译 的 。 

(2) 函数 calloc 

calloc 与 malloc 在 操作 上 非常 相似 ， 它 们 主要 的 区 别 是 在 原型 上 : 

void * calloc (size t nelements, size t size); 

因为 它 接收 2 个 参数 而 不 是 1 个 。 这 两 个 参数 相 乘 被 用 来 计算 所 需 内 存 块 的 总 长 度 。 通 常 第 
一 个 参数 nelements 是 元 素 的 个 数 ， 第 二 个 参数 size 被 用 来 表示 每 个 元 素 的 长 度 。 例 如 ， 我 们 可 以 
像 下 面 这 样 用 calloc 定义 bobby: 


int * bobby; 
bobby - (int *) calloc (5, sizeof(int)); 


malloc 和 calloc 的 另 一 点 不 同 在 于 calloc 会 将 所 有 的 元 素 初始 化 为 0。 
(3) 函数 realloc 

这 个 函数 用 来 改变 已 经 被 分 配给 一 个 指针 的 内 存 的 长 度 。 

void * realloc (void * pointer, size t size); 


参数 pointer. 用 来 传递 一 个 已 经 被 分 配 内 存 的 指针 或 一 个 空 指针 , 而 参数 size 用 来 指明 新 的 内 
存 长 度 。 这 个 函数 给 指针 分 配 size 字 节 的 内 存 。 这 个 函数 可 能 需要 改变 内 存 块 的 地 址 ， 以 便 能 够 
分 配 足够 的 内 存 来 满足 新 的 长 度 要 求 。 在 这 种 情况 下 , 指针 当前 所 指 的 内 存 中 的 数据 内 容 将 会 被 复 


cssc 
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制 到 新 的 地 址 中 ， 以 保证 现存 数据 不 会 丢失 。 函 数 返回 新 的 指针 地 址 。 如 果 新 的 内 存 尺寸 不 能 够 被 
满足 ， 函 数 将 会 返回 一 个 空 指针 ， 但 原来 参数 中 的 指针 pointer. 及 其 内 容 保持 不 变 。 


(4) 函数 free 


这 个 函数 用 来 释放 被 前 面 malloc、calloc 或 realloc 所 分 配 的 内 存 块 。 
void free (void * pointer); 


注意 : 这 个 函数 只 能 被 用 来 释放 由 函数 malloc、calloc 和 realloc 所 分 配 的 空间 。 


3.5.4 ”结构 体 


一 个 结构 体 是 组 合 到 同一 定义 下 的 一 组 不 同类 型 的 数据 ， 各 个 数据 类 型 的 长 度 可 能 不 同 。 它 


的 形式 是 : 


struct model name ( 
typel elementl; 
type2 element2; 
type3 element3; 


) object name; 


这 里 model name 是 这 个 结构 类 型 的 一 个 模块 名 称 。object_name 为 可 选 参数 ， 是 一 个 或 多 个 


具体 结构 对 象 的 标识 。 在 花 括 号 〈{ } ) 内 是 组 成 这 一 结构 的 各 个 元 素 的 类 型 和 子 标识 。 


如 果 结 构 的 定义 包括 参数 model name 〈 可 选 ) ， 该 参数 即 成 为 一 个 与 该 结构 等 价 的 有 效 的 类 


型 名 称 ， 例 如 : 


型 。 


struct products { 

char name [30]; 

float price; 

u 

products apple; 
products orange, melon; 


我 们 首先 定义 了 结构 模块 products， 它 包含 两 个 域 : name 和 price， 每 一 个 域 是 不 同 的 数据 类 
然后 用 这 个 结构 类 型 的 名 称 (products) 来 声明 3 个 该 类 型 的 对 象 : apple、orange 和 melon。 
一 旦 被 定义 ，products 就 成 为 一 个 新 的 有 效 数据 类 型 名 称 ， 可 以 像 其 他 基本 数据 类 型 (如 int、 


char 或 short) 一 样 ， 被 用 来 声明 该 数据 类 型 的 对 象 (object) 变量 。 


在 结构 定义 的 结尾 可 以 加 可 选项 object_name， 作 用 是 直接 声明 该 结构 类 型 的 对 象 。 例如， 我 


们 也 可 以 这 样 声明 结构 对 象 apple、orange 和 melon: 


struct products { 

char name [30]; 

float price; 

)apple, orange, melon; 
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并 且 ， 像 上 面 的 例子 中 ， 如 果 在 定义 结构 的 同时 声明 结构 的 对 象 ， 参 数 model name (这 个 例 
子 中 的 products) 将 变 为 可 选项 。 但 是 如 果 没 有 model_name， 我 们 将 不 能 在 后 面 的 程序 中 用 它 来 
声明 更 多 此 类 结构 的 对 象 。 

清楚 地 区 分 结构 模型 和 它 的 对 象 的 概念 是 很 重要 的 。 参 考 我 们 对 变量 所 使 用 的 术语 ， 模 型 是 
一 个 类 型 ， 而 对 象 是 变量 。 我 们 可 以 从 同一 个 模型 实例 化 出 很 多 对 象 。 

在 我 们 声明 了 确定 结构 模型 的 3 个 对 象 (apple、orange 和 melon) 之 后 ， 就 可 以 对 它们 的 各 个 
域 (field) 进行 操作 了 ， 通 过 在 对 象 名 和 域名 之 间 插 入 符号 点 〈.) 来 实现 。 例 如 ， 我 们 可 以 像 使 
用 一 般 的 标准 变量 一 样 对 下 面 的 元 素 进 行 操作 : 





apple.name 
apple.price 
orange.name 
orange.price 
melon.name 
melon.price 


它们 每 一 个 都 有 对 应 的 数据 类 型 : apple.name、orange.name 和 melon.name 是 字符 数组 类 型 
Cchar[30]) ， 而 apple.price、orange.price 和 melon.price 是 浮 点 型 (float) 。 
下 面 我 们 看 一 个 例子 。 


【 例 3.36】 一 个 结构 体 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
#include <stdlib.h> 
#include <string.h> 


struct movies t { 
char title[50]; 
int year; 

)mine, yours; 


void printmovie(movies t movie); 


int main() ( 
char buffer[50]; 
strcpy(mine.title, "2001 A Space Odyssey"); 
mine.year = 1968; 
cout «« "Enter title: "; 
cin.getline(yours.title, 50); 
cout «« "Enter year: "; 
cin.getline(buffer, 50); 
yours.year - atoi (buffer); 
cout << "My favourite movie is:Mn "; 
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printmovie (mine); 

cout << "And yours: Mn"; 
printmovie(yours); 
return 0; 


) 


void printmovie(movies t movie) ( 
cout «« movie.title; 
cout << " (" << movie.year << ")\n"; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

Enter title: boss 

Enter year: 1999 

My favourite movie is: 

2001 A Space Odyssey (1968) 

And yours: 

boss (1999) 


从 这 个 例子 中 可 以 看 到 如 何 像 使 用 普通 变量 一 样 使 用 一 个 结构 的 元 素 及 其 本 身 。 例 如 ， 
yours.year 是 一 个 整 型 数据 Gnt) ， 而 mine.title 是 一 个 长 度 为 50 的 字符 数组 。 

注意 , 这 里 mine 和 yours 也 是 变量 , 它们 是 movies t. 类 型 的 变量 , 被 传递 给 函数 printmovie()。 
因此 ， 结 构 的 重要 优点 之 一 就 是 既 可 以 单独 引用 它 的 元 素 ， 也 可 以 引用 整个 结构 数据 块 。 

结构 经 常 被 用 来 建立 数据 库 ， 特 别 是 当 我 们 考虑 结构 数组 的 时 候 。 


【 例 3.37】 数 组 结构 体 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
#include <stdlib.h> 
#include <string.h> 


#define N MOVIES 5 

struct movies t { 
char title[50]; 
int year; 

} films[N MOVIES]; 


void printmovie(movies t movie); 


int main() ( 
char buffer[50]; 
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int n; 

for (n = 0; n < N MOVIES; n++) ( 
cout «« "Enter title: "; 
cin.getline(films[n].title, 50); 
cout «« "Enter year: "; 
cin.getline(buffer, 50); 
films[n].year = atoi(buffer); 


cout << "AnYou have entered these movies: Wn"; 

for (n = 0; n < N MOVIES; n++) 
printmovie(films[n]); 

return 0; 


void printmovie(movies t movie) ( 
cout «« movie.title; 
cout << " (" << movie.year << ")WMn"; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
Enter title: boss 

Enter year: 1101 

Enter title: pupil 

Enter year: 1100 

Enter title: student 

Enter year: 990 

Enter title: b2 

Enter year: 999 

Enter title: b3 

Enter year: 998 


You have entered these movies: 
boss (1101) 

pupil (1100) 

student (990) 

b2 (999) 

b3 (998) 


2. 结构 指针 
就 像 其 他 数据 类 型 一 样 ， 结 构 也 可 以 有 指针 。 其 规则 同 其 他 基本 数据 类 型 一 样 : 指针 必须 被 
声明 为 一 个 指向 结构 的 指针 : 


struct movies t { 
char title [50]; 
int year; 
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NH 
movies t amovie; 
movies t * pmovie; 


这 里 amovie 是 一 个 结构 类 型 movies t 的 对 象 ， 而 pmovie 是 一 个 指向 结构 类 型 movies t 的 
对 象 的 指针 。 所 以 ， 同 基本 数据 类 型 一 样 ， 以 下 表达 式 是 正确 的 : 


pmovie = &amovie; 
下 面 我 们 看 另 一 个 例子 ， 将 引入 一 种 新 的 操作 符 。 


【 例 3.38】 结 构 指针 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 

using namespace std; 

#include <stdlib.h> 

struct movies t ( 
char title[50]; 
int year; 


int main() ( 
char buffer[50]; 


movies t amovie; 
movies t * pmovie; 
pmovie - & amovie; 


cout << "Enter title: "; 
cin.getline(pmovie-»title, 50); 
cout << "Enter year: "; 


cin.getline(buffer, 50); 
pmovie-»year - atoi (buffer); 


cout << "AnYou have entered: Mn"; 
cout << pmovie-»title; 
cout << " (" << pmovie-»year << ")Wn"; 


return 0; 


H 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

Enter title: boss 

Enter year: 1998 
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You have entered: 
boss (1998) 


上 面 的 代码 中 引入 了 一 个 重要 的 操作 符 : ->。 这 是 一 个 引用 操作 符 ， 常 与 结构 或 类 的 指针 一 起 
使 用 ， 以 便 引 用 其 中 的 成 员 元 素 ， 这 样 就 可 以 避免 使 用 很 多 括号 。 例 如 ， 我 们 用 : 


pmovie->title 
RRE: 
(*pmovie) .title 


以 上 两 种 表达 式 pmovie->title 和 (*pmovie).title 都 是 合法 的 ， 都 表示 取 指 针 pmovie 所 指向 的 
结构 的 元 素 title 的 值 。 我 们 要 清楚 地 将 它 和 以 下 表达 式 区 分 开 : 


*pmovie.title 
它 相 当 于 : 
*(pmovie.title) 


表示 取 结 构 pmovie 的 元 素 title 作为 指针 所 指向 的 值 ， 这 个 表达 式 在 本 例 中 没有 意义 ， 因 为 
title 本 身 不 是 指针 类 型 。 
表 3-6 中 总 结 了 指针 和 结构 组 成 的 各 种 可 能 的 组 合 。 


表 3-6 ”指针 和 结构 组 成 的 可 能 的 组 合 





表达 式 描述 等 价 于 


pmovie->title 指针 pmovie 所 指向 的 结构 的 元 “| (*pmovie).title 
素 title 的 值 





*pmovie.title 结构 pmovie 的 元 素 title 作为 指 | *(pmovie.title) 
针 所 指向 的 值 


3. AARE 
H LACE REF], BU ASFJITI JG R AS Ep XC REUS — "SEIS, un: 


struct movies t ( 
char title [50]; 
int year; 


) 


struct friends t ( 

char name [50]; 

char email [50]; 

movies t favourite movie; 

) charlie, maria; 

friends t * pfriends = &charlie; 


因此 ， 在 有 以 上 声明 之 后 ， 我 们 可 以 使 用 下 面 的 表达 式 : 
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charlie.name 

maria.favourite movie.title 
charlie.favourite movie.year 
pfriends-»favourite movie.year 


以 上 最 后 两 个 表达 式 等 价 。 
本 节 中 所 讨论 的 结构 的 概念 与 c 语言 中 结构 的 概念 是 一 样 的 。 然 而 ， 在 C++ 中 ， 结 构 的 概念 
已 经 被 扩展 到 与 类 Class) 相同 的 程度 ， 只 是 它 所 有 的 元 素 都 是 公开 的 (public) 。 


3.5.5 _ 自 定义 数据 类 型 


前 面 我 们 已 经 看 到 过 一 种 用 户 〈 程 序 员 ) 定义 的 数据 类 型 : 结构 。 除 此 之 外 ， 还 有 一 些 其 他 
类 型 的 用 户 自 定义 数据 类 型 。 


1. 定义 自己 的 数据 类 型 ( typedef ) 


C++ 允许 我 们 在 现 有 数据 类 型 的 基础 上 定义 自己 的 数据 类 型 。 我 们 将 用 关键 字 typedef 来 实现 
这 种 定义 ， 它 的 形式 是 : 


typedef existing type new type name; 


这 里 existing type 是 C++ 基本 数据 类 型 或 其 他 已 经 被 定义 了 的 数据 类 型 ,new_type_name 是 
我 们 将 要 定义 的 新 数据 类 型 的 名 称 ， 例 如 : 

typedef char C; 

typedef unsigned int WORD; 

typedef char * string t; 

typedef char field [50]; 

在 上 面 的 例子 中 , 我 们 定义 了 4 种 新 的 数据 类 型 : C、WORD string t 和 field, 分 别 代替 char, 
unsigned int、char* 和 char[50] 。 这 样 ， 我 们 就 可 以 安全 地 使 用 以 下 代码 : 

C achar, anotherchar, *ptcharl; 

WORD myword; 

string t ptchar2; 

field name; 

如 果 在 一 个 程序 中 反复 使 用 一 种 数据 类 型 , 而 在 以 后 的 版 本 中 有 可 能 改变 该 数据 类 型 ,typedef 
就 很 有 用 了 。 或 者 如 果 一 种 数据 类 型 的 名 称 太 长 ， 想 用 一 个 比较 短 的 名 字 来 代替 ， 也 可 以 使 用 
typedef. 

2. 联合 

KA (Union) 使 得 同一 段 内 存 可 以 按照 不 同 的 数据 类 型 来 访问 ， 数 据 实际 是 存储 在 同一 个 位 
置 的 。 它 的 声明 和 使 用 看 起 来 与 结构 〈structure) 十 分 相似 ， 但 实际 功能 是 完全 不 同 的 : 

union model name ( 

typel elementl; 


type2 element2; 
type3 element3; 
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H object name; 
union 中 的 所 有 被 声明 的 元 素 占据 同一 段 内 存 空间 , 其 大 小 取 声明 中 最 长 的 元 素 的 大 小 , 例如 : 
union mytypes 七 { 
char c; 
int i; 
float f; 
) mytypes; 
定义 了 3 个 元 素 : 


mytypes.c 
mytypes.i 
mytypes.f 


每 一 个 是 一 种 不 同 的 数据 类 型 。 既然 它们 都 指向 同一 段 内 存 空 间 , 改变 其 中 一 个 元 素 的 值 将 会 
影响 所 有 其 他 元 素 的 值 。 
union 的 用 途 之 一 是 将 一 种 较 长 的 基本 类 型 与 由 其 他 比较 小 的 数据 类 型 组 成 的 结构 (structure) 
或 数组 Carray) 联合 使 用 ， 例 如 : 
union mix 七 { 
long 1; 
struct { 


short hi; 
short lo; 


} s; 
char c[4]; 
} mix; 
以 上 例子 中 定义 了 3 个 名 称 : mixl, mixs 和 mix.c， 我 们 可 以 通过 这 3 个 名 字 来 访问 同一 段 
4 字 节 长 的 内 存 空间 。 至 于 使 用 哪 一 个 名 字 来 访问 , 取决 于 我 们 想 使 用 什么 数据 类 型 ,是 long short, 
还 是 char。 图 3-20 显示 了 在 这 个 联合 (union〉 中 各 个 元 素 在 内 存 中 的 可 能 结构 ， 以 及 我 们 如 何 通 
过 不 同 的 数据 类 型 进行 访问 。 


3. 匿名 联合 

在 C++ 中 ,我 们 可 以 选择 使 联合 (union) 匿 名 。 如 果 我 们 将 一 个 union 包括 在 一 个 结构 (structure) 
的 定义 中 ， 并 且 不 赋予 它 object 名 称 CREIRES P 后 面 的 名 字 ) ， 这 个 union WEE 
名 的 。 这 种 情况 下 ， 我 们 可 以 直接 使 用 union 中 元 素 的 名 字 来 访问 该 元 素 ， 而 不 需要 再 在 前 面 加 
union 对 象 的 名 称 。 在 表 3-7 的 例子 中 ， 我 们 可 以 看 到 这 两 种 表达 方式 在 使 用 上 的 区 别 。 
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表 3-7 ”两 种 表达 方式 











union anonymous union 
struct { struct { 
char title[50]; char title[50]; 
char author[50]; char author[50]; 
union { union { 
float dollars; float dollars; 
int yens; int yens; 
} price; p 
j book; } book; 





以 上 两 种 定义 唯一 的 区 别 在 于 左边 的 定义 中 我 们 给 了 union 一 个 名 字 price， 而 在 右边 的 定义 
中 没 给 。 在 使 用 时 的 区 别 是 ， 当 我 们 想 访 问 一 个 对 象 (object) 的 元 素 dollars 和 yens 时 ， 在 前 一 
种 定义 的 情况 下 ， 需 要 使 用 : 

book.price.dollars 

book.price.yens 


而 在 后 一 种 定义 下 ， 我 们 直接 使 用 : 


book.dollars 
book.yens 


再 一 次 提醒 ， 因 为 这 是 一 个 联合 Cunion) , JA dollars 和 yens 占据 的 是 同一 块 内 存 空间 ， 所 
以 它们 不 能 被 用 来 存储 两 个 不 同 的 值 。 也 就 是 你 可 以 使 用 一 个 dollars 或 yens 的 价格 ， 但 不 能 同时 
使 用 两 者 。 

4. 枚 举 

枚 举 Cenumerations). 可 以 用 来 生成 一 些 任 意 类 型 的 数据 ， 不 只 限于 数字 类 型 或 字符 类 型 ， 甚 
至 常量 true 和 false。 它 的 定义 形式 如 下 : 


enum model name ( 
valuel, 
value2, 
value3, 


) ELE 
例如 ， 我 们 可 以 定义 一 种 新 的 变量 类 型 color t 来 存储 不 同 的 颜色 : 


enum colors t (black, blue, green, cyan, red, purple, yellow, white]; 


注意 ， 在 这 个 定义 里 ， 我 们 没有 使 用 任何 基本 数据 类 型 。 换 名 话说， 我 们 创造 了 一 种 新 的 数 
据 类 型 ， 而 它 并 没有 基于 任何 已 存在 的 数据 类 型 : 类 型 color t， 花 括号 ({}) 中 包括 它 所 有 的 可 
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能 取 值 。 例 如 ， 在 定义 了 colors t 类 型 后 ， 我 们 可 以 使 用 以 下 表达 式 : 


colors 七 mycolor; 
mycolor = blue; 
if (mycolor == green) mycolor = red; 
实际 上 , 我 们 的 枚 举 数据 类 型 在 编译 时 是 被 编译 为 整 型 数值 的 , 而 它 的 数值 列表 可 以 是 任何 指 
定 的 整 型 常量 。 如 果 没 有 指定 常量 ， 枚 举 中 第 一 个 列 出 的 可 能 值 为 0 ， 后 面 的 每 一 个 值 为 前 面 一 
个 值 加 1。 因 此 ， 在 前 面 定义 的 数据 类 型 colors t "P, black 相当 于 0, blue 相当 于 1, green 相 
当 于 2 ， 后 面 以 此 类 推 。 
如 果 在 定义 枚 举 数据 类 型 的 时 候 明 确 指定 某 些 可 能 值 〈 例 如 第 一 个 ) 的 等 价 整 数值 ， 后 面 的 
数值 将 会 在 此 基础 上 增加 ， 例 如 : 
enum months t { january-1, february, march, april, 
may, june, july, august, 
september, october, november, december) y2k; 
在 这 个 例子 中 , 枚 举 类 型 months _t 的 变量 y2k 可 以 是 12 种 可 能 取 值 中 的 任何 一 个 , 从 january 
到 december ， 它 们 相当 于 数值 1~12， 而 不 是 0~11， 因 为 我 们 已 经 指定 january 等 于 1。 





3.6 面向 对 象 编程 


3.6.1 类 


类 (class) 是 一 种 将 数据 和 函数 组 织 在 同一 个 结构 里 的 逻辑 方法 。 定 义 类 的 关键 字 为 class， 其 
功能 与 C 语言 中 的 struct 类 似 ， 不 同 之 处 是 class 可 以 包含 函数 ， 而 不 像 struct 只 能 包含 数据 元 素 。 
类 定义 的 形式 是 : 
class class name { 
permission label 1: 
memberl; 
permission label 2: 
member2; 


) object name; 

Fh, class name 是 类 的 名 称 〈 用 户 自 定义 的 类 型 ) ， 而 可 选项 object name 是 一 个 或 几 个 对 
象 CobjecO 标识 。class 的 声明 体 中 包含 成 员 (members) ， 成 员 可 以 是 数据 或 函数 定义 ， 同 时 也 
可 以 包括 允许 范围 标志 (permission labels) ， 范 围 标 志 可 以 是 这 3 个 关键 字 中 的 任意 一 个 : private、 
public 或 protected。 它 们 分 别 代表 以 下 含义 。 

private: class 的 private 成 员 ， 只 有 同一 个 class 的 其 他 成 员 或 该 class Hf] “friend” class 可 以 
访问 这 些 成 员 。 

protected: class 的 protected 成 员 ， 只 有 同一 个 class 的 其 他 成 员 , 或 该 class 的 “friend” class, 
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或 该 class 的 子 类 (derived classes) 可 以 访问 这 些 成 员 o 
public: class 的 public 成 员 ， 任 何 可 以 看 到 这 个 class 的 地 方 都 可 以 访问 这 些 成 员 。 
如 果 我 们 在 定义 一 个 class 成 员 的 时 候 没 有 声明 其 允许 范围 ， 这 些 成 员 将 被 默认 为 private 范围 。 
例如 : 


class CRectangle ( 
int x, y; 
public: 
void set values (int,int); 
int area (void); 
) rect; 
上 面 的 例子 定义 了 一 个 class CRectangle 和 该 class 类 型 的 对 象 变量 rect。 这 个 class 有 4 个 成 
员 : 两 个 整 型 变量 (x 和 y), TE private 部 分 (因为 private 是 默认 的 允许 范围 ); 两 个 函数 : set_values() 
和 area()， 在 public 部 分 ， 这 里 只 包含 函数 的 原型 (prototype) 。 
注意 class 名 称 与 对 象 (object) 名 称 的 不 同 : 在 上 面 的 例子 中 ，CRectangle 是 class 名 称 〈 即 
用 户 定义 的 类 型 名 称 ) ， 而 rect 是 一 个 CRectangle 类 型 的 对 象 名 称 。 它 们 的 区 别 就 像 下 面 的 例子 
中 类 型 名 int 和 变量 名 a 的 区 别 一 样 : 





int a; 


int 是 class 名 称 〈 类 型 名 ) ， 而 a 是 对 象 名 〈 变 量 ) 。 
在 程序 中 ， 我 们 可 以 通过 使 用 对 象 名 后 面 加 一 点 再 加 成 员 名 称 〈 同 使 用 C structs 一 样 ) 来 引 
用 对 象 rect 的 任何 public 成 员 ， 就 像 它 们 只 是 一 般 的 函数 或 变量 ， 例 如 : 


rect.set value (3,4); 
myarea = rect.area(); 


但 我 们 不 能 够 引用 x SX y ， 因 为 它们 是 该 class 的 private 成 员 ， 它 们 只 能 够 在 该 class 的 其 
他 成 员 中 被 引用 。 下 面 是 关于 class CRectangle 的 一 个 复杂 的 例子 。 


【 例 3.39】 第 一 个 类 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
class CRectangle { 
ant x, y; 
public: 
void set values(int, int); 
int area(void) (return (x*y);} 
N 


void CRectangle::set values(int a, int b) ( 


mo EN 
y = b; 
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int main() ( 
CRectangle rect; 
rect.set values(3, 4); 
cout << "area: " << rect.area()««endl; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
area: 12 


上 面 代码 中 新 的 东西 是 在 定义 函数 set_valuesO 时 使 用 的 范围 操作 符 (::)。 它 是 用 来 在 一 个 class 
之 外 定义 该 class 的 成 员 。 注 意 ， 我 们 在 CRectangle class 内 部 已 经 定义 了 函数 area0 的 具体 操作 ， 
因为 这 个 函数 非常 简单 。 而 对 于 函数 set_values()， 在 class 内 部 只 是 定义 了 它 的 原型 prototype， 而 
其 实现 是 在 class 之 外 定义 的 。 这 种 在 class 之 外 定义 其 成 员 的 情况 必须 使 用 范围 操作 符 ::。 

范围 操作 符 C 声明 了 被 定义 的 成 员 所 属 的 class 名 称 ， 并 赋予 被 定义 成 员 适 当 的 范围 属性 ， 
这 些 范围 属性 与 在 class 内 部 定义 的 成 员 的 属性 是 一 样 的 。 例 如 ， 在 上 面 的 例子 中 ， 我 们 在 函数 
set values() 中 引用 了 private 变量 x 和 y， 这 些 变量 只 有 在 class 内 部 和 它 的 成 员 中 才 是 可 见 的 。 

在 class 内 部 直接 定义 完整 的 函数 , 和 只 定义 函数 的 原型 而 把 具体 实现 放 在 class 外 部 的 唯一 区 
别 在 于 ， 在 第 一 种 情况 下 ， 编 译 器 Ccompiler) 会 自动 将 函数 作为 inline 考虑 ， 而 在 第 二 种 情况 下 ， 
函数 只 是 一 般 的 class 成 员 函 数 。 

我 们 把 x 和 y 定 义 为 private 成 员 ( 记 住 , 如 果 没 有 特殊 声明 ,所 有 class 的 成 员 均 默认 为 private)， 
原因 是 已 经 定义 了 一 个 设置 这 些 变量 值 的 函数 Cset_values()) ， 这 样 一 来 ， 在 程序 的 其 他 地 方 就 没 
有 办 法 直接 访问 它们 。 也 许 在 这 样 简单 的 一 个 例子 中 ， 你 无 法 看 到 保护 两 个 变量 有 什么 意义 ， 但 在 
比较 复杂 的 程序 中 ， 这 是 非常 重要 的 ， 因 为 它 使 得 变量 不 会 被 意外 修改 〈 这 里 的 意外 是 从 object 
的 角度 来 讲 的 ) 。 

使 用 class 的 一 个 更 大 的 好 处 是 我 们 可 以 用 它 来 定义 多 个 不 同 对 象 (object) 。 例 如 ， 接 着 上 面 
class CRectangle 的 例子 ， 除 了 对 象 rect 之 外 ， 我 们 还 可 以 定义 对 象 rectb， 如 下 面 的 代码 : 





#include <iostream> 
using namespace std; 
class CRectangle ( 
int x, y; 
public: 
void set values (int,int); 
int area (void) (return (x*y);) 


void CRectangle::set values (int a, int b) ( 
x-a; 
y= D; 

} 


we 
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int main () ( 
CRectangle rect, rectb; 
rect.set values (3,4); 
rectb.set values (5,6); 


cout << "rect area: " << rect.area() << endl; 
cout << "rectb area: " << rectb.area() << endl; 
) 
输出 结果 是 : 


rect area: 12 

rectb area: 30 

注意 : 调用 函数 rectarea() 与 调用 rectb.area0 所 得 到 的 结果 是 不 一 样 的 。 这 是 因为 每 一 个 class 
CRectangle 的 对 象 都 拥有 它 自 己 的 变量 x 和 y， 以 及 它 自 己 的 函数 set_value() 和 area(). 

这 是 基于 对 象 (object) 和 面向 对 象 编程 (object-oriented programming) 的 概念 的 。 这 个 概念 
中 ,数据 和 函数 是 对 象 的 属性 (properties ) ， 而 不 是 像 以 前 在 结构 化 编程 (structured programming) 
中 所 认为 的 对 象 是 函数 参数 。 后 面 将 讨论 面向 对 象 编程 的 好 处 。 

在 这 个 例子 中 ， 我 们 讨论 的 class Cobject 的 类 型 ) 是 CRectangle， 有 两 个 实例 Cinstance) ， 
或 称 对 象 : rect 和 rectb， 每 一 个 有 它 自 己 的 成 员 变量 和 成 员 函 数 。 


3.6.2 ”构造 函数 和 析 构 函数 

对 象 在 生成 过 程 中 通常 需要 初始 化 变量 或 分 配 动态 内 存 ， 以 便 我 们 能 够 操作 ， 或 防止 在 执行 
过 程 中 返回 意外 结果 。 例 如 ， 在 前 面 的 例子 中 ， 如 果 我 们 在 调用 函数 set_values( ) 之 前 就 调用 了 函 
数 area()， 将 会 产生 什么 样 的 结果 呢 ? 可 能 会 是 一 个 不 确定 的 值 ， 因 为 成 员 x 和 y 还 没有 被 赋予 
任何 值 。 

为 了 避免 这 种 情况 发 生 ， 一 个 class 可 以 包含 一 个 特殊 的 函数 : 构造 函数 (constructor) ， 它 
可 以 通过 声明 一 个 与 class 同名 的 函数 来 定义 。 当 且 仅 当 要 生成 一 个 class 的 新 实例 (instance) 的 
时 候 ， 也 就 是 当 且 仅 当 声明 一 个 新 的 对 象 ， 或 给 该 class 的 一 个 对 象 分 配 内 存 的 时 候 ， 这 个 构造 函 
数 将 自动 被 调用 。 下 面 将 实现 包含 一 个 构造 函数 的 CRectangle。 


【 例 3.40】 构 造 函 数 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 





#include <iostream> 
using namespace std; 
class CRectangle { 
int width, height; 
public: 
CRectangle (int, int); 
int area (void) {return (width*height);) 
}; 


CRectangle::CRectangle(int a, int b) { 
width = a; 
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height = b; 
) 


int main() ( 
CRectangle rect(3, 4); 
CRectangle rectb(5, 6); 
cout << "rect area: " << rect.area() << endl; 
cout << "rectb area: " << rectb.area() << endl; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

rect area: 12 

rectb area: 30 

正如 你 所 看 到 的 ， 这 个 例子 的 输出 结果 与 上 一 个 例子 没有 区 别 。 在 这 个 例子 中 ， 我 们 只 是 把 
函数 set. values 换 成 了 class 的 构造 函数 。 注 意 这 里 参数 是 如 何在 class 实例 生成 的 时 候 传递 给 构造 
函数 的 : 

CRectangle rect (3,4); 

CRectangle rectb (5,6); 
同时 你 可 以 看 到 ， 构 造 函 数 的 原型 和 实现 中 都 没有 返回 值 Creturn value) ， 也 没有 void 类 型 
的 声明 。 构 造 函 数 必须 这 样 写 。 一 个 构造 函数 永远 没有 返回 值 ， 也 不 用 声明 void， 就 像 我 们 在 前 
面 的 例子 中 看 到 的 。 
析 构 函数 (destructor) 的 功能 完全 相反 。 它 在 对 象 从 内 存 中 释放 的 时 候 被 自动 调用 。 释 放 可 
能 是 因为 它 存在 的 范围 已 经 结束 了 例如， 对 象 被 定义 为 一 个 函数 内 的 本 地 (local) 对 象 变量 ,而 
该 函数 结束 了 ， 该 对 象 也 就 自动 释放 了 ) ; 或 者 是 因为 它 是 一 个 动态 分 配 的 对 象 , 在 使 用 操作 符 的 
时 候 被 释放 Cdelete) 了 。 

析 构 函数 必须 与 class 同名 ， 加 水 波 号 ~) 前 级 ， 必 须 无 返回 值 。 

析 构 函数 特别 适用 于 当 一 个 对 象 被 动态 分 配 内 存 空间 ， 而 在 对 象 被 销毁 时 ， 我 们 希望 释放 它 
所 占用 的 空间 的 时 候 。 


【 例 3.41】 构 造 函 数 和 析 构 函数 的 例子 
(OD 打开 UE， 输 入 代码 如 下 : 











#include <iostream> 
using namespace std; 
class CRectangle { 
int *width, *height; 
public: 
CRectangle(int, int); 
^CRectangle(); 
int area(void) (return (*width * *height);] 
}; 
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CRectangle::CRectangle(int a, int b) ( 
width = new int; 
height 
*width a; 
*height = b; 


new int; 


) 


CRectangle::-CRectangle() ( 
delete width; 
delete height; 

) 


int main() ( 
CRectangle rect(3, 4), rectb(5, 6); 
cout << "rect area: " << rect.area() << endl; 
cout << "rectb area: " << rectb.area() << endl; 
return 0; 


} 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

rect area: 12 

rectb area: 30 


3.6.3 ”构造 函数 重 载 

像 其 他 函数 一 样 ， 一 个 构造 函数 也 可 以 被 多 次 重 载 overload ) 为 同样 名 字 的 函数 ， 但 有 不 同 
的 参数 类 型 和 个 数 。 注意 编译 器 会 调用 与 在 调用 时 刻 要 求 的 参数 类 型 和 个 数 一 样 的 那个 函数 。 在 这 
里 则 是 调用 与 类 对 象 被 声明 时 一 样 的 那个 构造 函数 。 

实际 上 ， 当 我 们 定义 一 个 class 而 没有 明确 定义 构造 函数 的 时 候 ， 编 译 器 会 自动 假设 两 个 重 载 
的 构造 函数 〈 默 认 构造 函数 〈default constructor) 和 复制 构造 函数 (copy constructor) ) 。 例 如 ， 
对 以 下 class: 

class CExample ( 
public: 
int a,b,c? 


void multiply (int n, int m) { a-n; b=m; c-a*b; }; 


没有 定义 构造 函数 ， 编 译 器 自动 假设 它 有 以 下 constructor 成 员 函 数 : 
Empty constructor 
这 是 一 个 没有 任何 参数 的 构造 函数 ， 被 定义 为 nop 〈 没 有 语句 ) 。 它 什么 都 不 做 。 


CExample::CExample () ( }; 
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Copy constructor 


这 是 一 个 只 有 一 个 参数 的 构造 函数 ， 该 参数 是 这 个 class 的 一 个 对 象 ， 这 个 函数 的 功能 是 将 被 
传 入 的 对 象 (object) 的 所 有 非 静 态 (non-static) 成 员 变 量 的 值 都 复制 给 自身 的 对 象 。 


CExample::CExample (const CExample& rv) { 
a-rv.a; b-rv.b; c-rv.c; 
H 


必须 注意 : 这 两 个 默认 构造 函数 (Empty construction 和 Copy constructor ) 只 有 在 没有 其 他 构 
造 函 数 被 明确 定义 的 情况 下 才 存 在 。 如 果 任 何其 他 有 任意 参数 的 构造 函数 被 定义 了 , 这 两 个 构造 函 
数 就 都 不 存在 了 。 在 这 种 情况 下 ， 如 果 你 想 要 有 Empty construction 和 Copy constructor， 就 必须 自 
己 定 义 它们 。 

当然 ， 你 也 可 以 重 载 class 的 构造 函数 ， 定 义 有 不 同 的 参数 或 完全 没有 参数 的 构造 函数 ， 见 如 
下 例子 。 


【 例 3.42】 重 载 类 的 构造 函数 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
class CRectangle { 
int width, height; 
public: 
CRectangle(); 
CRectangle(int, int); 
int area(void) (return (width*height);] 
) 


" 


CRectangle::CRectangle() ( 
width = 5; 
height - 5; 

) 


CRectangle::CRectangle(int a, int b) ( 
width = a; 
height - b; 

} 


int main() { 
CRectangle rect(3, 4); 
CRectangle rectb; 
cout << "rect area: " << rect.area() << endl; 
cout << "rectb area: " << rectb.area() << endl; 
} 


(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 
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[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

rect area: 12 

rectb area: 25 


在 上 面 的 例子 中 ，rectb 被 声明 的 时 候 没 有 参数 ， 所 以 它 被 使 用 没有 参数 的 构造 函数 进行 初始 
也 就 是 width 和 height 都 被 赋值 为 5。 
注意 ， 在 我 们 声明 一 个 新 的 object 的 时 候 ， 如 果 不 想 传 入 参数 ， 就 不 需要 写 括号 “0”: 





CRectangle rectb; // right 
CRectangle rectb(); // wrong! 


3.6.4 类 的 指针 


类 也 是 可 以 有 指针 的 ， 要 定义 类 的 指针 ， 我 们 只 需要 认识 到 ， 类 一 旦 被 定义 就 成 为 一 种 有 效 


的 数据 类 型 ， 因 此 只 需要 用 类 的 名 字 作 为 指针 的 名 字 就 可 以 了 ， 例 如 : 


CRectangle * prect; 


是 一 个 指向 class CRectangle 类 型 的 对 象 的 指针 。 


就 像 数 据 结构 中 的 情况 一 样 ， 要 想 直 接 引 用 一 个 由 指针 指向 的 对 象 object) 中 的 成 员 ， 需 要 


使 用 操作 符 ->。 下 面 是 一 个 例子 ， 显 示 了 几 种 可 能 出 现 的 情况 。 
【 例 3.43】 类 的 指针 的 例子 


(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


class CRectangle { 
int width, height; 
public: 
void set values(int, int); 
int area(void) (return (width * height);) 


void CRectangle::set values(int a, int b) ( 
width = a; 
height = b; 

5 


int main() ( 
CRectangle a, *b, *c; 
CRectangle * d = new CRectangle[2]; 
b = new CRectangle; 
c = &a; 
a.set_values (1, 2); 
b->set_values (3, 4); 
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d-»set values(5, 6); 
8); 


d[1].set values(7, 


cout << "a area: " << a.area() << endl; 


cout << "*b area: " 
cout << "#0 area: " 
cout << "d[0] area: 
cout << "d[1] area: 
return 0; 


) 


(20. 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


<< b-»area() << endl; 
<< c->area() << endl; 
" << d[0].area() << endl; 
" << d[1].area() << endl; 


[root@localhost test]# g++ test.cpp -o test 


[root@localhost test]# 
a area: 2 

*b area: 12 

*c area: 2 

d[0] area: 30 

d[1] area: 56 


以 下 是 怎样 读 前 面 例子 中 出 现 的 一 些 指针 和 类 操作 符 CH RS us 


./test 


xx 读 作 : pointed by x (由 x 指向 的 ) 
&x 读 作 : address of x (x 的 地 址 ) 
x.y 读 作 : member y of object x (对 象 x 的 成 员 y) 


(*x).y 读 作 : member y of object pointed by x (由 x 指 向 的 对 象 的 成 员 y) 


Ss [Ds 


x->y 读 作 : member y of object pointed by x (同上 一 个 等 价 ) 
x[0] Bf: first object pointed by x (由 x 指 向 的 第 一 个 对 象 ) 
x[1] BE: second object pointed by x (由 x 指 向 的 第 二 个 对 象 ) 
x[n] 读 作 : (n+1)th object pointed by x (由 x 指 向 的 第 n+1 个 对 象 ) 


在 继续 向 下 阅读 之 前 ， 一 定 要 确定 明白 这 些 指 针 和 类 操作 符 的 逻辑 含义 。 如 果 你 还 有 疑问 ， 可 


以 再 读 一 遍 这 一 小 节 的 内 容 。 


3.6.5 ”由 关键 字 struct 和 union 定义 的 类 
类 不 仅 可 以 用 关键 字 class 来 定义 ， 也 可 以 用 struct 或 union 来 定义 。 


因为 在 C++ 中 ， 类 和 数据 结构 的 概念 太 相 似 了 ， 所 以 这 两 个 关键 字 struct 和 class 的 作用 几乎 
是 一 样 的 〈 也 就 是 说 ， 在 CHP, struct 定义 的 类 也 可 以 有 成 员 函 数 ， 而 不 仅仅 有 数据 成 员 ) 。 两 
者 定义 的 类 的 唯一 区 别 在 于 ， 由 class 定义 的 类 所 有 成 员 的 默认 访问 权限 为 private， 而 struct 定义 


的 类 所 有 成 员 默 认 访问 权限 为 public。 除 此 之 外 ， 两 个 关键 字 的 作用 是 相同 的 。 


union 的 概念 与 struct 和 class 定义 的 类 不 同 ， 因 为 union 在 同一 时 间 只 能 存储 一 个 数据 成 员 。 
但 是 由 union 定义 的 类 也 是 可 以 有 成 员 函 数 的 。union 定义 的 类 访问 权限 默认 为 public. 


3.6.6 ”操作 符 重 载 


C++ 实现 了 在 类 Class) 之 间 使 用 语言 标准 操作 符 , 而 不 只 是 在 基本 数据 类 型 之 间 使 用 , 例如 : 
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iot a; bDi Ci 
a = b+ or 





是 有 效 操作 ， 因 为 加 号 两 边 的 变量 都 是 基本 数据 类 型 。 然而 , 我 们 是 否 可 以 进行 下 面 的 操作 就 不 是 
那么 显而易见 了 〈 它 实际 上 是 正确 的 》: 





struct ( char product [50]; float price; } a, b, c; 

a= p tef 

将 一 个 类 (或 结构 ) 的 对 象 赋 给 另 一 个 同 种 类 型 的 对 象 是 允许 的 〈 通 过 使 用 默认 的 复制 构造 函 
数 (copy constructor) ) 。 但 相 加 操作 就 有 可 能 产生 错误 ， 理 论 上 讲 ， 它 在 非 基本 数据 类 型 之 间 是 
无 效 的 。 

但 归功 于 C++ 的 操作 符 重 载 能 力 ， 我 们 可 以 完成 这 个 操作 。 像 上 面 的 例子 中 这 样 的 组 合 类 型 
的 对 象 ， 在 C++ 中 可 以 接受 如 果 没 有 操作 符 重 载 就 不 能 被 接受 的 操作 ， 我 们 甚至 可 以 修改 这 些 操 
作 符 的 效果 。 以 下 是 所 有 可 以 被 重 载 的 操作 符 的 列表 : 








* = * / - « > += -= *= /= << >> 
<<= >>= == != <= >= t -- $ & WS u | 
= &= ^= I= es 11 $= [1 0 new delete 


要 想 重 载 一 个 操作 符 ， 只 需要 编写 一 个 成 员 函 数 ， 名 为 operator， 后 面 跟 要 重 载 的 操作 符 ， 遵 
循 以 下 原型 定义 : 


type operator sign (parameters); 


这 里 是 一 个 操作 符 “+” 的 例子 。 我 们 要 计算 二 维 向 量 a(3,1) 与 b(1,2) 的 和 。 两 个 二 维 向 量 相 
加 的 操作 很 简单 ， 就 是 将 两 个 x 轴 的 值 相 加 获得 结果 的 x 值 ， 将 两 个 y 轴 的 值 相 加 获得 结果 的 y 
值 。 在 这 个 例子 里 ， 结 果 是 (3+1,1+2) = (4,3). 


【 例 3.44】 操 作 符 重 载 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


class CVector { 
public: 
int x, y; 
CVector() {} 


5 
CVector(int, int); 


CVector operator -*(CVector); 


CVector::CVector(int a, int b) ( 
x-a; 
y = b; 
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CVector CVector::operator*(CVector param) ( 
CVector temp; 
temp.x x + param.x; 
temp.y = y + param.y; 
return (temp); 


int main() { 
CVector a(3, 1); 
CVector b(1, 2); 
CVector c; 
c-atb; 
cout << Cx << Vm << c.y<<endl; 
return 0; 


) 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
4,3 


你 是 否 迷 惑 为 什么 看 到 这 么 多 遍 的 CVector， 那 是 因为 其 中 有 些 是 指 class 名 称 CVector , ifj 
另 一 些 是 以 它 命名 的 函数 名 称 ， 不 要 把 它们 搞 混 了 : 


CVector (int, int); // 函数 名 称 CVector (constructor) 

CVector operator* (CVector);  // 函数 operator+ 返回 cCVector 类 型 的 值 

Class CVector 的 函数 operator+ 是 对 数学 操作 符 “+” 进 行 重 载 的 函数 。 这 个 函数 可 以 用 以 下 两 
种 方法 进行 调用 : 

c 

c 


at pi 
a.operator+ (b); 


注意 : 我 们 在 这 个 例子 中 包括 了 一 个 空 构造 函数 〈 无 参数 ) ， 而 且 将 它 定义 为 无 任何 操作 : 
CVector () { }; 
这 是 很 必要 的 ， 因 为 例子 中 己 经 有 另 一 个 构造 函数 ， 


CVector (int, int); 














因此 ， 如 果 我 们 不 像 上 面 这 样 明 确定 义 一 个 的 话 ，CVector 的 两 个 默认 构造 函数 都 不 存在 。 
这 样 ，main( ) 中 包含 的 语句 : 


CVector c; 


将 为 不 合法 的 。 
尽管 如 此 ， 已 经 警告 过 一 个 空 语句 块 (no-op block) 并 不 是 一 种 值得 推荐 的 构造 函数 的 实现 方 
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式 ， 因 为 它 不 能 实现 一 个 构造 函数 应 该 完成 的 基本 功能 ， 也 就 是 初始 化 class 中 的 所 有 变量 。 在 我 
们 的 例子 中 ,这 个 构造 函数 没有 完成 对 变量 x 和 y 的 定义 。 因 此 ， 一 个 更 值得 推荐 的 构造 函数 定义 
应 该 像 下 面 这 样 : 


CVector ( ) { x-0; y-0; }; 


就 像 一 个 class 默认 包含 一 个 空 构造 函数 和 一 个 复制 构造 函数 一 样 ， 它 同时 包含 一 个 对 赋值 操 
作 符 (=) 的 默认 定义 ， 该 操作 符 用 于 两 个 同类 对 象 之 间 。 这 个 操作 符 将 其 参数 对 象 〈 符 号 右边 的 
对 象 ) 的 所 有 非 静 态 non-static) 数据 成 员 复制 给 其 左边 的 对 象 。 当 然 ， 你 也 可 以 将 它 重新 定义 为 
想 要 的 任何 功能 ， 例 如 只 复制 某 些 特定 class 成 员 。 

重 载 一 个 操作 符 并 不 要 求 保 持 其 常规 的 数学 含义 ， 虽 然 这 是 推荐 的 。 例 如 ， 我 们 可 以 将 操作 
符 “+” 定 义 为 取 两 个 对 象 的 差 值 ， 或 用 “一 ”操作 符 将 一 个 对 象 赋 为 0， 但 这 样 做 没有 什么 逻辑 
意义 。 

函数 operator- 的 原型 定义 看 起 来 很 明显 ， 因 为 它 取 操 作 符 右边 的 对 象 为 其 左边 对 象 的 函数 
operator+ 的 参数 ， 其 他 的 操作 符 就 不 一 定 这 么 明显 了 。 表 3-8 总 结 了 不 同 的 操作 符 函 数 是 怎样 定义 
声明 的 〈 用 操作 符 蔡 换 每 个 @) 。 








表 3-8 不 同 操作 符 函 数 的 定义 声明 


p] —— — qa p 


这 里 a 是 class A 的 一 个 对 象 ，b 是 class B. 的 一 个 对 象 ，c 是 class C 的 一 个 对 象 。 

从 表 3-8 可 以 看 出 有 两 种 方法 重 载 一 些 class 操作 符 : 作为 成 员 函 数 或 作为 全 域 函 数 。 它 们 的 
用 法 没有 区 别 ， 但 是 要 提醒 一 下 ， 如 果 不 是 class 的 成 员 函 数 ， 就 不 能 访问 该 class 的 private 或 
protected 成 员 ， 除 非 这 个 全 域 函 数 是 该 class 的 friend (friend. 的 含义 将 在 后 面 解释 ) 。 





3.6.7 关键 字 this 

关键 字 this 通常 被 用 在 一 个 class 内 部 ， 指 正在 被 执行 的 该 class 的 对 象 Cobject) 在 内 存 中 的 
地 址 。 它 是 一 个 指针 ， 其 值 永 远 是 自身 对 象 的 地 址 。 

关键 字 this 可 以 被 用 来 检查 传 入 一 个 对 象 的 成 员 函 数 的 参数 是 不 是 该 对 象 本 身 。 
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【 例 3.45】 关 键 字 this 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


class CDummy { 
public: 

int isitme(CDummy& param); 
] 


int CDummy::isitme(CDummy& param) { 
if (&param -- this) return 1; 
else return 0; 


int main() ( 
CDummy a; 
CDummy* b = &a; 
if (b-»isitme(a)) 
cout << "yes, &a is b\n"; 
return 0; 


| 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[rootélocalhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 
yes, &a is b 
它 还 经 常 被 用 在 成 员 函 数 operator- 中 ， 用 来 返回 对 象 的 指针 (避免 使 用 临时 对 象 》。 下 面 用 
前 面 看 到 的 向 量 (vector〉 的 例子 来 看 一 下 函数 operator= 是 怎样 实现 的 : 
CVector& CVector::operator- (const CVector& param) { 
x-param.x; 
y-param.y; 
return *this; 
H 
实际 上 ， 如 果 我 们 没有 定义 成 员 函 数 operator=， 编 译 器 自动 为 该 class 生成 的 默认 代码 有 可 能 
就 是 这 个 样子 的 。 


3.6.8 ”静态 成 员 


一 个 class 可 以 包含 静态 成 员 (static members) ， 可 以 是 数据 ， 也 可 以 是 函数 。 
一 个 class 的 静态 数据 成 员 也 被 称 作 类 变量 (class variables) ， 因 为 它们 的 内 容 不 依赖 于 某 个 
对 象 ， 同 一 个 class 的 所 有 object 具有 相同 的 值 。 
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例如 ， 可 以 被 用 作 计 算 一 个 class 声明 的 objects 的 个 数 ， 例 子 如 下 。 


【 例 3.46】 静 态 成 员 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


class CDummy ( 
public: 
static int n; 
CDummy() ( n++; } 
; 
^CDummy() ( n--; } 


; 


int CDummy::n = 0; 


int main() ( 
CDummy a; 
CDummy b[5]; 
CDummy * c = new CDummy; 
cout << a.n << endl; 
delete c; 
cout << CDummy::n << endl; 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

T 

6 


实际 上 ， 静 态 成 员 与 全 域 变量 (global variable) 具有 相同 的 属性 , 但 它 享有 类 Class) 的 范围 。 
因此 ， 根 据 ANSI-C++ 标准 ， 为 了 避免 它们 被 多 次 重复 声明 ， 在 class 的 声明 中 只 能 够 包括 static 
member 的 原型 〈 声 明 ) ， 而 不 能 够 包括 其 定义 〈 初 始 化 操作 ) 。 为 了 初始 化 一 个 静态 数据 成 员 ， 
我 们 必须 在 class 之 外 〈 在 全 域 范围 内 ) 包括 一 个 正式 的 定义 ， 就 像 上 面 例子 中 的 做 法 一 样 。 

因为 它 的 同一 个 class 的 所 有 object 是 同一 个 值 , 所 以 可 以 被 该 class 的 任何 object 的 成 员 所 引 
用 ,或 者 直接 作为 class 的 成 员 引 用 〈 只 适用 于 static 成 员 ) : 


cout << a.n; 
cout << CDummy::n; 


以 上 两 个 调用 都 指 同一 个 变量 : class CDummy 里 的 static 变量 n。 再 提醒 一 次 ， 这 其 实 是 一 个 
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全 域 变量 。 唯 一 的 不 同 是 它 的 名 字 跟 在 class 的 后 面 。 

就 像 我 们 会 在 class 中 包含 static 数据 一 样 ,也 可 以 使 它 包含 static 函数 .它们 表示 相同 的 含义 : 
static 函数 是 全 域 函 数 (global functions) ， 但 是 像 一 个 指定 class 的 对 象 成 员 一 样 被 调用 。 人 它们 只 
能 够 引用 static 数据 , 永远 不 能 引用 class 的 非 静态 Cnonstatic ) 成 员 。 它们 也 不 能 够 使 用 关键 字 this, 
因为 this 实际 引用 了 一 个 对 象 指针 ， 但 这 些 static 函数 却 不 是 任何 object 的 成 员 ， 而 是 class 的 直 
接 成 员 。 


3.6.9 类 之 间 的 关系 


1. 友 元 函数 
在 前 面 的 章节 中 ， 我 们 已 经 看 到 了 对 class 的 不 同 成 员 存 在 3 个 层次 的 内 部 保护 : publics 
protected 和 private。 在 成 员 为 protected 和 private 的 情况 下 ， 它 们 不 能 够 被 从 所 在 的 class 以 外 的 
部 分 引用 。 然 而 ， 这 个 规则 可 以 通过 在 一 个 class 中 使 用 关键 字 friend 来 绕 过 ， 这 样 我 们 可 以 允许 
一 个 外 部 函数 获得 访问 class 的 protected 和 private 成 员 的 能 力 。 

为 了 实现 允许 一 个 外 部 函数 访问 class 的 private 和 protected 成 员 ， 我 们 必须 在 class 内 部 用 
关键 字 friend 来 声明 该 外 部 函数 的 原型 ， 以 指定 允许 该 函数 共享 class 的 成 员 。 在 下 面 的 例子 中 ， 
我 们 声明 了 一 个 friend 函数 duplicate. 





【 例 3.47】 友 元 函数 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


class CRectangle { 
int width, height; 
Public: 
void set values(int, int); 
int area(void) (return (width * height);] 
friend CRectangle duplicate (CRectangle); 


void CRectangle::set values(int a, int b) ( 
width = a; 
height = b; 

b 


CRectangle duplicate(CRectangle rectparam) { 
CRectangle rectres; 
rectres.width = rectparam.width * 2; 
rectres.height - rectparam.height * 2; 
return (rectres); 
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} 


int main() { 
CRectangle rect, rectb; 
rect.set values(2, 3); 
rectb = duplicate (rect); 
cout «« rectb.area() «« endl; 


} 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

24 

函数 duplicate 是 CRectangle 的 friend， 因 此 在 该 函数 之 内 ， 我 们 可 以 访问 CRectangle 类 型 的 
各 个 object 的 成 员 width 和 height。 注 意 , 在 duplicate0 的 声明 中 ， 及 其 在 后 面 main() 里 被 调用 的 
时 候 ， 我 们 并 没有 把 duplicate 当 作 class CRectangle 的 成 员 ， 它 不 是 。 

friend. 函数 可 以 被 用 来 实现 两 个 不 同 class 之 间 的 操作 。 广 义 来 说 ， 使 用 friend 函数 是 面向 对 
象 编 程 之 外 的 方法 ， 因 此 ， 如 果 可 能 ， 应 尽量 使 用 class 的 成 员 函 数 来 完成 这 些 操作 。 比 如 在 上 面 
的 例子 中 ， 将 函数 duplicate) 集成 在 class CRectangle 可 以 使 程序 更 短 。 





2. 友 元 类 
就 像 我 们 可 以 定义 一 个 friend 函数 ， 也 可 以 定义 一 个 class 是 另 一 个 的 friend， 以 便 允 许 第 二 
个 class 访问 第 一 个 class 的 protected 和 private 成 员 。 


【 例 3.48】 友 元 类 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
class CSquare; 


class CRectangle { 
int width, height; 

public: 
int area(void) (return (width * height);} 
void convert (CSquare a); 


class CSquare ( 

private: 
int side; 

public: 
void set side(int a)(side = a; ) 
friend class CRectangle; 
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) 


P 


void CRectangle::convert (CSquare a) ( 
width = a.side; 
height = a.side; 

) 


int main() ( 
CSquare sqr; 
CRectangle rect; 
Sqr.set side(4); 
rect.convert (sqr); 
cout << rect.area()««endl; 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

16 

在 这 个 例子 中 ,我 们 声明 了 CRectangle 是 CSquare 的 friend, 因 此 CRectangle 可 以 访问 CSquare 
的 protected 和 private 成 员 ， 更 具体 地 说 ， 可 以 访问 CSquare::side， 它 定义 了 正方 形 的 边 长 。 

在 上 面 程序 的 第 一 个 语句 里 ， 你 可 能 也 看 到 了 一 些 新 的 东西 ， 就 是 class CSquare 空 原型 。 这 
是 必需 的 ， 因 为 在 CRectangle 的 声明 中 ， 我 们 引用 了 CSquare EJ convert() 的 参数 ) 。CSquare 
的 定义 在 CRectangle 的 后 面 ， 因 此 如 果 我 们 没有 在 这 个 class 之 前 包含 一 个 CSquare 的 声明 , 它 在 
CRectangle 中 就 是 不 可 见 的 。 

这 里 要 考虑 到 ， 如 果 没 有 特别 指明 ， 友 元 关系 Cfriendships) 并 不 是 相互 的 。 在 CSquare 的 例 
子 中 ，CRectangle 是 一 个 friend 类 ， 但 因为 CRectangle 并 没有 对 CSquare 做 相应 的 声明 ， 所 以 
CRectangle 可 以 访问 CSquare 的 protected 和 private 成 员 , 但 反 过 来 并 不 行 , 除非 我 们 将 CSquare 
也 定义 为 CRectangle 的 friend。 

3. 类 之 间 的 继承 

类 的 一 个 重要 特征 是 继承 ， 这 使 得 我 们 可 以 基于 一 个 类 生成 另 一 个 类 的 对 象 ， 以 便 使 后 者 拥 
有 前 者 的 某 些 成 员 ， 再 加 上 它 自己 的 一 些 成 员 。 例 如, 假设 要 声明 一 系列 类 型 的 多 边 形 ， 比 如 长 方 
JÉ (CRectangle) 或 三 角形 〈CTriangle) 。 它 们 有 一 些 共 同 的 特征 ， 比 如 都 有 宽度 和 高 度 。 

这 个 特点 可 以 用 一 个 类 CPolygon 来 表示 ， 基 于 这 个 类 ， 我 们 可 以 引申 出 上 面 提 到 的 两 个 类 : 
CRectangle 和 CTriangle， 如 图 3-21 所 示 。 
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图 3-21 


类 CPolygon 包含 所 有 多 边 形 共有 的 成 员 。 在 我 们 的 例子 里 就 是 : width 和 height. 而 CRectangle 
和 CTriangle 将 为 它 的 子 类 (derived classes) 。 

由 其 他 类 引申 而 来 的 子 类 继承 基 类 的 所 有 可 视 成 员 ， 意 思 是 说 ， 如 果 一 个 基 类 包含 成 员 A， 
而 我 们 将 它 引申 为 另 一 个 包含 成 员 B 的 类 ， 则 这 个 子 类 将 同时 包含 A 和 B. 

要 定义 一 个 类 的 子 类 ， 我 们 必须 在 子 类 的 声明 中 使 用 冒号 操作 符 O ， 如 下 所 示 : 





class derived class name: public base class name; 


这 里 derived class name FHER, base class name 为 基 类 名 称 。public 也 可 以 根据 需要 换 
X protected 或 private， 描 述 被 继承 的 成 员 的 访问 权限 ， 在 以 下 例子 中 会 很 快 看 到 。 


【 例 3.49】 被 继承 成 员 的 访问 权限 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
class CPolygon { 
protected: 
int width, height; 
Public: 
void set values(int a, int b) { width = a; height = b; } 
) 


; 


class CRectangle : public CPolygon ( 
public: 
int area(void)( return (width * height); } 


class CTriangle : public CPolygon ( 
public: 

int area(void)( return (width * height / 2); } 
N 


int main() ( 
CRectangle rect; 
CTriangle trgl; 
rect.set values(4, 5); 
trgl.set values(4, 5); 
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cout << rect.area() << endl; 
cout «« trgl.area() «« endl; 
return 0; 


} 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

20 

10 

如 上 所 示 , 类 CRectangle 和 CTriangle 的 每 一 个 对 象 都 包含 CPolygon 的 成 员 , 即 width, height 
和 set_values()。 

标识 符 protected 与 private 类 似 ， 它 们 的 唯一 区 别 在 继承 时 才 表 现 出 来 。 当 定义 一 个 子 类 的 时 
候 ， 基 类 的 protected 成 员 可 以 被 子 类 的 其 他 成 员 所 使 用 ， 然 而 private 成 员 就 不 可 以 。 因 为 我 们 希 
望 CPolygon 的 成 员 width 和 height 能 够 被 子 类 CRectangle 和 CTriangle 的 成 员 所 访问 ， 而 不 只 
是 被 CPolygon 自身 的 成 员 操作 ， 我 们 使 用 了 protected 访问 权限 ， 而 不 是 private. 

表 3-9 按照 谁 能 访问 总 结 了 不 同 访问 权限 类 型 。 


表 3-9 不 同 访问 权限 类 型 





可 以 访问 public protected private 


本 sss 的 成 


fm | 
LA |» ýE 
这 里 “ 非 成 员 ” 指 从 class 以 外 的 任何 地 方 引用 ， 例 如 从 main0 中 、 从 其 他 的 class 中 或 从 全 域 

(global) 或 本 地 Cocal) 的 任何 函数 中 。 
在 我 们 的 例子 中 ,CRectangle 和 CTriangle 继承 的 成 员 与 基 类 CPolygon 拥有 同样 的 访问 限制 : 





CPolygon: :width // Protected access 
CRectangle::width // protected access 
CPolygon::set values() // public access 


CRectangle::set values() // public access 


这 是 因为 在 继承 的 时 候 使 用 的 是 public， 记 得 我 们 用 的 是 : 














class CRectangle: public CPolygon; 


这 里 关键 字 public 表示 新 的 类 (CRectangle) 从 基 类 (CPolygon) 所 继承 的 成 员 必 须 获得 最 
低 程度 保护 。 这 种 被 继承 成 员 的 访问 限制 的 最 低 程 度 可 以 通过 使 用 protected 或 private 而 不 是 
public 来 改变 。 例 如 ，daughter 是 mother 的 一 个 子 类 ， 我 们 可 以 这 样 定义 : 


class daughter: protected mother; 


这 将 使 得 protected. 成 为 daughter 从 mother 处 继承 的 成 员 的 最 低 访 问 限制 。 也 就 是 说 ， 原 来 
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mother 中 的 所 有 public 成 员 到 daughter 中 将 会 成 为 protected 成 员 ， 这 是 它们 能 够 被 继承 的 最 低 
访问 限制 。 当 然 ， 这 并 不 是 限制 daughter 不 能 有 它 自 己 的 public 成 员 。 最 低 访问 权限 限制 只 是 建 
立 在 从 mother 中 继承 的 成 员 上 。 

最 常用 的 继承 限制 除了 public 外 就 是 private， 它 被 用 来 将 基 类 完全 封装 起 来 ， 因 为 在 这 种 情 
况 下 , 除了 子 类 自身 外 , 其 他 任何 程序 都 不 能 访问 那些 从 基 类 继承 而 来 的 成 员 。 不 过 大 多 数 情况 下 ， 
继承 都 是 使 用 public 的 。 

如 果 没 有 明确 写 出 访问 限制 ， 所 有 由 关键 字 class 生成 的 类 被 默认 为 private， 而 所 有 由 关键 字 
struct 生成 的 类 被 默认 为 public。 

4. 基 类 的 继承 


理论 上 说 ， 子 类 〈drived class). 继承 了 基 类 (base class). 的 所 有 成 员 ， 除 了 构造 函数 和 析 构 函 
数 : 





operator-() 成 员 
friends 


虽然 基 类 的 构造 函数 和 析 构 函数 没有 被 继承 ， 但 是 当 一 个 子 类 的 object 被 生成 或 销毁 的 时 候 ， 
其 基 类 的 默认 构造 函数 〈 即 没有 任何 参数 的 构造 函数 ) 和 析 构 函数 总 是 被 自动 调用 的 。 

如 果 基 类 没有 默认 构造 函数 ， 或 你 希望 当 子 类 生成 新 的 object 时 ， 基 类 的 某 个 重 载 的 构造 函 
数 被 调用 ， 你 需要 在 子 类 的 每 一 个 构造 函数 的 定义 中 指定 它 : 


derived class name (parameters) : base class name (parameters) {} 
【 例 3.50】 基 类 继承 的 例子 
(D 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
class mother { 
public: 
mother () 
{ cout << "mother: no parameters\n"; } 
mother (int a) 
{ cout << "mother: int parameter\n"; } 
] 


class daughter : public mother ( 
public: 
daughter(int a) 
( cout << "daughter: int parameter\n\n"; } 
b; 


class son : public mother { 
public: 
son(int a) 
: mother (a) 
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( cout << "son: int parameter\n\n"; } 
HN 


int main() ( 
daughter cynthia(1); 
son daniel(1); 
return 0; 
) 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

mother: no parameters 

daughter: int parameter 


mother: int parameter 
Son: int parameter 


观察 当 一 个 新 的 daughter object 生成 的 时 候 , mother 的 哪 一 个 构造 函数 被 调用 了 , 而 当 新 的 son 
object 生成 的 时 候 ， 又 是 哪 一 个 被 调用 了 。 不 同 的 构造 函数 被 调用 是 因为 daughter 和 son 的 构造 
函数 的 定义 不 同 : 


daughter (int a) // 没有 特别 指定 : 调用 默认 constructor 
son (int a) : mother (a) // 指定 了 constructor: 调用 被 指定 的 构造 函数 
5. 多 重 继承 


在 C++ 中 ， 一 个 class 可 以 从 多 个 class 中 继承 属性 或 函数 ， 只 需要 在 子 类 的 声明 中 用 逗号 将 
不 同 基 类 分 开 就 可 以 了 。 例 如 ， 有 一 个 特殊 的 class COutput 可 以 实现 向 屏幕 打印 的 功能 ， 我 们 同 
时 希望 类 CRectangle 和 CTriangle 在 CPolygon 之 外 还 继承 一 些 其 他 的 成 员 ， 可 以 这 样 写 : 


class CRectangle: public CPolygon, public COutput ( 
class CTriangle: public CPolygon, public COutput ( 


以 下 是 一 个 完整 的 例子 。 
【 例 3.51】 多 重 继承 的 例子 
(1) 打开 UE， 输 入 代码 如 下 


#include <iostream> 
using namespace std; 
class CPolygon { 
protected: 
int width, height; 
public: 
void set _ values (int a, int b) 
( width = a; height = b; } 





C++ 语言 基础 


#3 





class COutput { 
public: 

void output(int i); 
N 


void COutput::output(int i) ( 
cout «« i «« endl; 


) 


class CRectangle : public CPolygon, public COutput { 
public: 
int area(void) 
( return (width * height); ) 


class CTriangle : public CPolygon, public COutput ( 
public: 
int area(void) 
( return (width * height / 2); } 
Hu 


int main() ( 
CRectangle rect; 
CTriangle trgl; 
rect.set values(4, 5); 
trgl.set values(4, 5); 
rect.output (rect.area()); 
trgl.output (trgl.area()); 
return 0; 


} 
2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 


20 
10 
3.6.10 多 态 
1. 基 类 的 指针 


继承 的 好 处 之 一 是 一 个 指向 子 类 (derived class) 的 指针 与 一 个 指向 基 类 (base class) 


的 指针 





是 类 型 兼容 的 。 本 节 重 点 介绍 如 何 利用 C++ 的 这 一 重要 特性 。 我 们 将 结合 C++ 的 这 个 功能 重 写 前 





面 关于 长 方形 和 三 角形 的 程序 。 
【 例 3.52】 指 向 基 类 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 
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#include <iostream> 
using namespace std; 
class CPolygon { 
protected: 


int width, height; 


public: 


void set values(int a, int b) ( 
width - a; height - b; 
) 


E 
class CRectangle : public CPolygon ( 
public: 


int area(void) ( 
return (width * height); 
) 


Hn 
class CTriangle : public CPolygon ( 
public: 


int area(void) ( 
return (width * height / 2); 
) 


int main() ( 


) 


CRectangle rect; 

CTriangle trgl; 

CPolygon * ppolyl - &rect; 
CPolygon * ppoly2 - &trgl; 
ppolyl-»set values(4, 5); 
ppoly2-»set values(4, 5); 
cout «« rect.area() «« endl; 
cout << trgl.area() «« endl; 
return 0; 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

20 

10 


在 主 函数 main 中 定义 了 两 个 指向 class CPolygon 的 对 象 的 指针 , 即 *ppolyl 和 *ppoly2。 它 
们 被 赋值 为 rect 和 trgl 的 地 址 ， 因 为 rect 和 trgl 是 CPolygon 的 子 类 的 对 象 ， 因 此 这 种 赋值 是 有 


效 的 。 


使 用 *ppolyl 和 *ppoly2 取代 rect 和 trgl 的 唯一 限制 是 *ppolyl 和 *ppoly2 是 CPolygon* 类 


型 的 ， 


因此 我 们 只 能 够 引用 CRectangle 和 CTriangle 从 基 类 CPolygon 中 继承 的 成 员 。 正 是 由 于 这 





个 原因 


， 我 们 不 能 够 使 用 *ppolyl 和 *ppoly2 来 调用 成 员 函 数 area()， 而 只 能 使 用 rect 和 trgl 来 


调用 这 个 函数 。 
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要 想 使 CPolygon 的 指针 承认 area() 为 合法 成 员 函 数 ， 必 须 在 基 类 中 声明 它 ， 而 不 能 只 在 子 类 
中 声明 。 

2. 虚拟 成 员 

如 果 想 在 基 类 中 定义 一 个 成 员 留 待 子 类 中 进行 细 化 , 我 们 必须 在 它 前 面 加 关键 字 virtual， 以 便 
可 以 使 用 指针 对 指向 相应 的 对 象 进行 操作 。 请 看 一 下 例子 。 
【 例 3.53】 虚 拟 成 员 的 例子 

(1) 打开 UE， 输 入 代码 如 下 : 





#include <iostream> 
using namespace std; 
class CPolygon ( 
protected: 
int width, height; 
public: 
void set values(int a, int b) ( 
width = a 


virtual int area(void) ( return (0); ) 
u 
class CRectangle : public CPolygon ( 
public: 

int area(void) ( return (width * height); } 
class CTriangle : public CPolygon ( 
public: 

int area(void) ( 

return (width * height / 2); 


int main() ( 
CRectangle rect; 
CTriangle trgl; 
CPolygon poly; 
CPolygon * ppolyl - &rect; 
CPolygon * ppoly2 - &trgl; 
CPolygon * ppoly3 = &poly; 
ppolyl-»set values(4, 5); 
ppoly2-»set values(4, 5); 
ppoly3-»set values(4, 5); 
cout «« ppolyl-»area() «« endl; 
cout «« ppoly2-»area() «« endl; 
cout << ppoly3-»area() << endl; 
return 0; 
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(20. 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 


20 

10 

0 

现在 这 3 个 类 (CPolygon、CRectangle 和 CTriangle) 都 有 同样 的 成 员 : width、height、set_values() 
和 area()。 


area() 被 定义 为 virtual 是 因为 它 后 来 在 子 类 中 被 细 化 了 。 你 可 以 做 一 个 试验 ， 如果 在 代码 中 去 
掉 这 个 关键 字 (virtual) ， 然 后 执行 这 个 程序 ，3 个 多 边 形 的 面积 计算 结果 都 将 是 0， 而 不 是 20、 
10、0。 这 是 因为 没有 了 关键 字 virtual， 程 序 执行 不 再 根据 实际 对 象 的 area0 函 数 〈 即 不 再 执行 
CRectangle:area() ~ CTriangle::area() 和 CPolygon:area() ) ， 取 而 代 之 ， 程 序 将 全 部 调用 
CPolygon::area()， 因 为 这 些 调用 是 通过 CPolygon 类 型 的 指针 进行 的 。 

因此 ， 关 键 字 virtual 的 作用 就 是 在 使 用 基 类 的 指针 的 时 候 ， 使 子 类 中 与 基 类 同名 的 成 员 在 适 
当 的 时 候 被 调用 ， 如 前 面 的 例子 所 示 。 

注意 , 虽然 本 身 被 定义 为 虚拟 类 型 , 我们 还 是 可 以 声明 一 个 CPolygon 类 型 的 对 象 并 调用 它 的 
area() 函数 ， 它 将 返回 0 ， 如 前 面 的 例子 结果 所 示 。 


3. 抽象 基 类 

基本 的 抽象 类 与 前 面 例子 中 的 类 CPolygon 非常 相似 , 唯一 的 区 别 是 在 前 面 的 例子 中 , 我 们 已 
经 为 类 CPolygon 的 对 象 (例如 对 象 poly) 定义 了 一 个 有 效 的 area() 函 数 , 而 在 一 个 抽象 类 Cabstract 
base class) 中 ， 我 们 可 以 对 它 不 定义 ， 而 简单 地 在 函数 声明 后 面 写 “=0” (等 于 0)。 

类 CPolygon 可 以 写成 这 样 : 





// abstract class CPolygon 
class CPolygon { 
protected: 
int width, height; 
public: 
void set values (int a, int b) ( 
width-a; 
height-b; 
} 
virtual int area (void) =0; 
We 
注意 我 们 是 如 何 为 virtual int area (void) 加 “=0” 来 代替 函数 的 具体 实现 的 。 这 种 函数 被 称 为 纯 
虚拟 函数 (pure virtual function), 而 所 有 包含 纯 虚 拟 函 数 的 类 被 称 为 抽象 基 类 (abstract base classes) 
抽象 基 类 的 最 大 不 同 是 它 不 能 够 有 实例 〈 对 象 ) ， 但 我 们 可 以 定义 指向 它 的 指针 。 因 此 ， 像 
这 样 的 声明 : 


CPolygon poly; 
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对 于 前 面 定 义 的 抽象 基 类 是 不 合法 的 。 


CPolygon * ppolyl; 
CPolygon * ppoly2; 


是 完全 合法 的 。 这 是 因为 该 类 包含 的 纯 虚 拟 函 数 是 没有 被 实现 的 , 而 又 不 可 能 生成 一 个 不 包含 它 的 
所 有 成 员 定义 的 对 象 。 然 而 ， 因 为 这 个 函数 在 其 子 类 中 被 完整 地 定义 了 ， 所 以 生成 一 个 指向 其 子 类 


的 对 象 的 指针 是 完全 合法 的 。 下 面 是 完整 的 例子 。 
【 例 3.54】 第 一 个 抽象 基 类 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
class CPolygon { 


protected: 
int width, height; 
public: 
void set_values (int a, int b) { 
width = a; 
height = b; 
} 
virtual int area (void) = 0; 


}; 
class CRectangle : 
public: 

int area(void) { return (width * height); 


public CPolygon { 


HN 
class CTriangle : 
public: 
int area(void) ( 
return (width * height / 2); 


public CPolygon ( 


} 

b; 

int main() { 
CRectangle rect; 
CTriangle trgl; 
CPolygon * ppoly1 = &rect; 
CPolygon * ppoly2 = &trgl; 
ppolyl-»set values(4, 5); 
ppoly2-»set values(4, 5); 
cout «« ppolyl-»area() «« endl; 
cout «« ppoly2-»area() «« endl; 
return 0; 


) 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 
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[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

20 

10 


再 看 一 遍 这 段 程序 ， 你 会 发 现 我 们 可 以 用 同一 种 类 型 的 指针 CCPolygon*O 指向 不 同类 的 对 象 ， 
这 一 点 非常 有 用 。 想 象 一 下 ,现在 我 们 可 以 写 一 个 CPolygon 的 成 员 函 数 , 使 得 它 可 以 将 函数 area() 


的 结果 打印 到 屏幕 上 。 
【 例 3.55】 第 二 个 抽象 基 类 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
class CPolygon { 
protected: 
int width, height; 
public: 
void set values(int a, int b) ( 
width = a; 
height = b; 
) 
virtual int area(void) = 0; 
void printarea (void) ( 
cout << this-»area() << endl; 
} 
}; 
class CRectangle : public CPolygon { 
public: 
int area(void) { return (width * height); } 
}; 
class CTriangle : public CPolygon { 
public: 
int area(void) ( 
return (width * height / 2); 
} 
b; 
int main() { 
CRectangle rect; 
CTriangle trgl; 
CPolygon * ppolyl = &rect; 
CPolygon * ppoly2 - &trgl; 
ppolyl-»set values(4, 5); 
ppoly2-»set values(4, 5); 
ppolyl-»printarea(); 
ppoly2-»printarea(); 
return 0; 
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(20. 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

20 

10 


注意 ，this 代表 代码 正在 被 执行 的 这 个 对 象 的 指针 。 
抽象 类 和 虚拟 成 员 赋予 了 CHEA (polymorphic) 的 特征 ， 使 得 面向 对 象 的 编程 ， 成 为 一 个 
有 用 的 工具 。 这 里 只 是 展示 了 这 些 功能 最 简单 的 用 途 。 想 象 一 下 ， 如 果 在 对 象 数组 或 动态 分 配 的 对 


象 上 使 用 这 些 功能 ， 将 会 节省 多 少 麻烦 。 
3.7 ”C++ 面向 对 象 小 结 


1. 类 和 对 象 的 区 别 

类 是 抽象 的 ， 对 象 是 具体 的 ， 所 以 类 不 占用 内 存 ， 而 对 象 占用 内 存 。 
总 之 类 是 对 象 的 抽象 ， 而 对 象 是 类 的 具体 事例 。 

假如 类 是 水 果 ， 那 么 对 象 就 是 香 菊 。 

2. 面向 对 象 的 三 大 特点 

面向 对 象 的 三 大 特点 是 封装 、 继 承 、 多 态 。 


3. 类 的 3 种 访问 限定 符 
(1) public (AHH) 
(2) private (私有 的 》 
(3) protected 〈 受 保护 的 ) 
它们 的 特点 如 下 : 
(1) public 成 员 可 从 类 外 部 直接 访问 ，private/protected 成 员 不 能 从 类 外 部 直接 访问 。 
(2) 每 个 限定 符 在 类 体 中 可 使 用 多 次 ， 它 的 作用 域 是 从 该 限定 符 出 现 开始 到 下 一 个 限定 符 之 
前 或 类 体 结束 前 。 
G) 类 体 中 如 果 没 有 定义 限定 符 ， 就 默认 为 私有 的 ， 而 struct 如 果 没 有 定义 限定 符 ， 就 默认 
为 公有 的 。 
(4) 类 的 访问 限定 符 体 现 了 面向 对 象 的 封装 性 。 
4. 类 的 作用 域 
(1) 每 个 类 都 定义 了 自己 的 作用 域 , 类 的 成 员 (成 员 函 数 / 成 员 变 量 ) 都 在 类 的 这 个 作用 域内 ， 
成 员 函 数 内 可 任意 访问 成 员 变量 和 其 他 成 员 函 数 。 
(2) 对 象 可 以 通过 “.” 直 接 访问 公有 成 员 ， 指 向 对 象 的 指针 通过 “->” 也 可 以 直接 访问 对 象 
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的 公有 成 员 。 

(3) 在 类 体外 定义 成 员 ， 需 要 使 用 “::” 作 用 域 解析 符 指明 成 员 属 于 哪个 类 域 。 

5. AH this 指针 

(1) 每 个 成 员 函 数 都 有 一 个 指针 形 参 ， 它 的 名 字 是 固定 的 ， 称 为 this 指针 ，this 指针 是 隐 式 
的 《构造 函数 比较 特殊 ， 没 有 这 个 隐 含 this 形 参 ) 。 

(2) 编译 器 会 对 成 员 函 数 进行 处 理 ， 在 对 象 调用 成 员 函 数 时 ， 对 象 地 址 作为 实 参 传递 给 成 员 
函数 的 第 一 个 形 参 this 指针 。 

(3) this 指针 是 成 员 函 数 隐 含 的 指针 形 参 ， 是 编译 器 自己 处 理 的 ， 我 们 不 能 在 成 员 函 数 的 形 
参 中 添加 this 指针 的 参数 定义 ， 也 不 能 在 调用 时 显示 传递 对 象 的 地 址 给 this 指针 。 

6. 类 的 6 个 默认 成 员 函 数 

(1) 构造 函数 

(20 拷贝 构造 函数 

G) 赋值 操作 符 重 载 

(4) 析 构 函数 

(5) 取 地 址 操作 符 重 载 

C6) const 修饰 的 取 地 址 操作 符 重 载 

7. 构造 函数 的 特征 

CD 函数 名 与 类 名 相同 。 

(2) 无 返回 值 。 

C30 对 象 构 造 时 系统 自动 调用 对 应 的 构造 函数 。 

(4) 构造 函数 可 以 重 载 。 

(5) 构造 函数 可 以 在 类 外 定义 ， 也 可 以 在 类 内 定义 。 

C6) 如 果 类 定义 中 没有 给 出 构造 函数 ，C++ 编 译 器 就 会 自动 产生 一 个 默认 的 构造 函数 ， 但 是 
只 要 我 们 定义 了 一 个 构造 函数 ， 系 统 就 不 会 自动 生成 默认 的 构造 函数 。 

(7) 无 参 的 构造 函数 和 全 默认 值 的 构造 函数 都 认为 是 默认 构造 函数 ， 并 且 默 认 的 构造 函数 只 
能 有 一 个 。 


比如 下 面 这 段 代码 : 


class Date 
{ 
public: 
Date () // 无 参 构造 函数 
{} 
Date (int year=1990 , int month = 1, int day = 1)// 全 默认 值 的 构造 函数 
: year (year) 
, _day (day) 
, month (month) 


* 196 - 
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protected: 
int year; 
int month; 
int day; 

i 


8. 拷贝 构造 函数 

(1) 拷贝 构造 函数 其 实 是 一 个 构造 函数 的 重 载 。 

(2) 拷贝 构造 函数 的 参数 必须 使 用 引用 传 参 ， 使 用 传 参 方式 会 引发 无 穷 递归 调用 。 

(3) 若 未 显 式 定义 ， 系 统 会 使 用 默认 的 拷贝 构造 函数 。 默 认 的 拷贝 构造 函数 会 依次 对 拷贝 类 
成 员 进行 初始 化 。 


9. 析 构 函数 


(1) 析 构 函数 在 类 名 前 加 上 字符 ~。 

(2) 析 构 函数 无 参数 、 无 返回 值 。 

G) 一 个 类 只 有 一 个 析 构 函数 ， 若 未 显 式 定义 ， 系 统 会 自动 生成 默认 的 析 构 函数 。 
(4) 对 象 生命 周期 结束 时 ，C++ 编 译 系 统 会 自动 调用 析 构 函数 。 

(5) 析 构 函数 体内 并 不 是 删除 对 象 ， 而 是 做 一 些 清理 工作 。 


class Array 
{ 
Public: 
Array(int size) 
t 
.ptr = (int*)malloc (sizeof (int)*size); 
) 
-Array() 
t 
Af (ptr) 
t 
free( ptr); 
.ptr - NULL; 
H 
} 
protected: 
int* "ptr; 


10. 类 成 员 变 量 的 两 种 初始 化 方式 
(1) 初始 化 列表 。 
(2) 构造 函数 体内 进行 赋值 。 


初始 化 列表 以 一 个 冒号 开始 , 接着 以 一 个 逗号 分 隔 数据 列表 , 每 个 数据 成 员 都 放 在 一 个 括号 中 
进行 初始 化 。 尽 量 使 用 初始 化 列表 进行 初始 化 ， 因 为 它 更 高 效 。 
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11. 友 元 函数 
在 C++ 中 ， 友 元 函数 允许 在 类 外 访问 该 类 中 的 任何 成 员 函 数 ， 就 像 成 员 函 数 一 样 ， 友 元 函数 
用 关键 字 friend 说 明 。 


CD. 友 元 函数 不 是 类 的 成 员 函 数 。 
(20 友 元 函数 可 以 通过 对 象 访问 所 有 成 员 ， 私 有 和 保护 成 员 也 一 样 。 


class Date 
{ 
friend void Display(const Date& d); 
public: 
Date(int year = 1990, int month = 1, int day = 22) 
:_year (year) 
, month (month) 
+ _day (day) 
ü 
private: 
int year; 
int month; 
int day; 
void Display(const Date& d) 
t 
cout << "year-" «« d. year << endl; 
cout «« "month-" «« d. month «« endl; 
cout «« "day" «« d. day «« endl; 
) 
int main() 
t 
Date d1; 
Display (d1); 
return 0; 


) 








E- 友 元 函数 在 一 定 程度 上 破坏 了 C++ 的 封装 ， 不 宜 多 用 ， 在 恰当 的 地 方 使 用 即 可 | 











12. 类 的 静态 成 员 函 数 
(1) 类 里 面 用 static 修饰 的 成 员 ， 称 为 静态 成 员 。 
(2) 类 的 静态 成 员 是 该 类 型 的 所 有 对 象 所 共享 的 。 
class Date 
t 
public : 

Date () 

t 


cout««"Date ()" ««endl; 
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++ sCount; 
H 
void Display () 
t 
cout««"year:" «« year«« endl; 
cout««"month:" «« month«« endl; 
cout««"day:" «« day«« endl; 


) 
// 静态 成 员 函 数 
Static void PrintCount () 
t 
cout««"Date count:" ««sCount«« endl; 
) 
private : 
int year ; // 年 
int month ; // H 
int day ; // H 
private : 


static int sCount; // 静态 成 员 变量 ， 统 计 创建 时 间 个 数 
Hn 
// 定义 并 初始 化 静态 成 员 变 量 


int Date::sCount = 0; 
void Test () 
t 
Date dl ,d2; 
// 访问 静态 成 员 
Date::PrintCount (); 
) 


静态 成 员 函 数 没 有 隐 含 this 指针 参数 ， 所 以 可 以 使 用 类 型 :: 作 用 域 访问 符 直接 调用 静态 成 员 函 数 。 
3.8 ”C++ 高 级 知识 


3.8.4 模板 

模板 CTemplates) 是 ANSLC++ 标准 中 新 引入 的 概念 。 如 果 你 使 用 的 C++ 编译 器 不 符合 这 
个 标准 ， 那 么 很 可 能 不 能 使 用 模板 。 

1. 函数 模板 

模板 使 得 我 们 可 以 生成 通用 的 函数 ， 这 些 函 数 能 够 接收 任意 数据 类 型 的 参数 ， 可 返回 任意 类 
型 的 值 ， 而 不 需要 对 所 有 可 能 的 数据 类 型 进行 函数 重 载 。 这 在 一 定 程度 上 实现 了 宏 (macro) 的 作 
用 。 它 们 的 原型 定义 可 以 是 下 面 两 种 中 的 任何 一 种 : 








template <class identifier> function declaration; 
template <typename identifier> function declaration; 
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上 面 两 种 原型 定义 的 不 同 之 处 在 于 关键 字 class 或 typename 的 使 用 。 它们 实际 是 完全 等 价 的 ， 
因为 两 种 定义 表达 的 意思 和 执行 都 一 模 一 样 。 
例如 ， 要 生成 一 个 模板 ， 返 回 两 个 对 象 中 较 大 的 一 个 ， 我 们 可 以 这 样 写 : 


template «class GenericType» 
GenericType GetMax (GenericType a, GenericType b) ( return (a»b?a:b); } 


在 第 一 行 声明 中 ， 己 经 生成 了 一 个 通用 数据 类 型 的 模板 ， 叫 作 GenericType。 因 此 ， 在 其 后 面 
的 函数 中 ，GenericType 成 为 一 个 有 效 的 数据 类 型 ， 它 被 用 来 定义 了 两 个 参数 a Mb, HAET 
函数 GetMax 的 返回 值 类 型 。 

GenericType 仍 没有 代表 任何 具体 的 数据 类 型 ， 当 函数 GetMax 被 调用 的 时 候 ， 我 们 可 以 使 用 
任何 有 效 的 数据 类 型 来 调用 它 。 这 个 数据 类 型 将 被 作为 pattern 来 代 蔡 函 数 中 GenericType 出 现 的 地 
方 。 用 一 个 类 型 pattern 来 调用 一 个 模板 的 方法 如 下 : 





function <type> (parameters); 
例如 ， 要 调用 GetMax 来 比较 两 个 int 类 型 的 整数 可 以 这 样 写 : 


int x,y; 
GetMax «int» (x,y); 


因此 ，GetMax 的 调用 就 好 像 所 有 的 GenericType 出 现 的 地 方 都 用 int 来 代替 一 样 。 下 面 是 一 
个 例子 。 


【 例 3.56】 第 一 个 函数 模板 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 

using namespace std; 

template «class T» T GetMax(T a, T b) ( 
T result; 
result = (a > b) ? a : b; 
return (result); 

} 


int main() { 
int E - 5, j - 6, k; 
long 1 = 10, m = 5, n; 
k = GetMax(i, j); 
n = GetMax(l, m); 
cout << k << endl; 
cout << n << endl; 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
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[rootélocalhost test]# ./test 

6 

10 

在 这 个 例子 中 ， 我 们 将 通用 数据 类 型 命名 为 T。 

在 上 面 的 例子 中 ， 我 们 对 同样 的 函数 GetMax() 使 用 了 两 种 参数 类 型 : int 和 long， 而 只 写 了 一 


种 函数 的 实现 ， 也 就 是 说 我 们 写 了 一 个 函数 的 模板 ， 用 了 两 种 不 同 的 pattem 来 调用 它 。 


如 你 所 见 ， 在 模板 函数 GetMax0 里 ， 类 型 T 可 以 被 用 来 声明 新 的 对 象 : 
T result; 


result 是 一 个 T 类 型 的 对 象 ， 就 像 a 和 b 一 样 ， 也 就 是 说 ， 它 们 都 是 同一 类 型 的 ， 这 种 类 型 就 


是 当 我 们 调用 模板 函数 时 ， 写 在 尖 括 号 〈 僵 ) 中 的 类 型 。 


在 这 个 具体 的 例子 中 ， 通 用 类 型 T 被 用 作 函 数 GetMax 的 参数 ， 不 需要 说 明 <int> 或 <long>， 


编译 器 也 可 以 自动 检测 到 传 入 的 数据 类 型 ， 因 此 ， 我 们 也 可 以 这 样 写 这 个 例子 : 


int i,j; 
GetMax (i,j); 


因为 1 和 j 都 是 int 类 型 ， 编 译 器 会 自动 假设 我 们 想 要 函数 按照 int 进行 调用 。 这 种 暗示 的 方 





法 更 为 有 用 ， 并 产生 同样 的 结果 。 
【 例 3.57】 第 二 个 函数 模板 的 例子 


(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 

using namespace std; 

template «class T» T GetMax(T a, T b) { 
return (a >b ? a : b); 


) 
int main() ( 


int i = 5, j = 6, k; 
long 1 = 10, m = 5, n; 
k = GetMax(i, j); 
n = GetMax(l, m); 
cout << k << endl; 
cout << n << endl; 
return 0; 

} 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

6 

10 
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注意 在 这 个 例子 的 main0 中 我 们 是 如 何 调用 模板 函数 GetMax0 而 没有 在 尖 括 号 Co 中 指明 
有 具体 数据 类 型 的 。 编 译 器 自动 决定 每 一 个 调用 需要 什么 数据 类 型 。 

因为 我 们 的 模板 函数 只 包括 一 种 数据 类 型 (class T) ， 而 且 它 的 两 个 参数 都 是 同一 种 类 型 ， 所 
以 不 能 够 用 两 个 不 同类 型 的 参数 来 调用 它 : 

int i; 

long 1; 

k = GetMax (i,1); 

上 面 的 调用 就 是 不 对 的 ， 因 为 函数 等 待 的 是 两 个 同 种 类 型 的 参数 。 

我 们 也 可 以 使 得 模板 函数 接收 两 种 或 两 种 以 上 类 型 的 数据 ， 例 如 : 

template <class T> 

T GetMin (Ta, U b) ( return (a<b?a:b); } 

在 这 个 例子 中 ， 模 板 函 数 GetMin() 接 收 两 个 不 同类 型 的 参数 ， 并 返回 一 个 与 第 一 个 参数 同类 
型 的 对 象 。 在 这 种 定义 下 ,我们 可 以 这 样 调用 该 函数 

int i,j; 

long 1; 

i = GetMin «int, long» (j,1); 

或 者 ， 简 单 地 用 : 

i = GetMin (j,1); 

虽然 j 和 !1 是 不 同 的 类 型 。 


2. 类 模板 
我 们 也 可 以 定义 类 模板 (class templates) ， 使 得 一 个 类 可 以 有 基于 通用 类 型 的 成 员 ， 而 不 需 
要 在 类 生成 的 时 候 定义 具体 的 数据 类 型 ， 例 如 


template «class T» 
class pair ( 
T values [2]; 
public: 
pair (T first, T second) ( 
values[0]-first; 
values[1]-second; 
b 


上 面 定义 的 类 可 以 用 来 存储 两 个 任意 类 型 的 元 素 。 例 如 ， 想 要 定义 该 类 的 一 个 对 象 ， 用 来 存 
储 两 个 整 型 数据 115 和 36， 可 以 这 样 写 : 


pair<int> myobject (115, 36); 


同时 ， 可 以 用 这 个 类 来 生成 另 一 个 对 象 ， 用 来 存储 任何 其 他 类 型 数据 ， 例 如 
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Pair<float> myfloats (3.0, 2.18); 


在 上 面 的 例子 中 ， 类 的 唯一 一 个 成 员 函 数 已 经 被 inline 定义 。 如 果 我 们 要 在 类 之 外 定义 它 的 
一 个 成 员 函 数 ， 就 必须 在 每 一 个 函数 前 面 加 template <... >。 


【 例 3.58 】 类 模板 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
template «class Type» 
class compare 
t 
public: 
compare (Type a, Type b) 
{ 
x= a 
y = b; 
} 
Type max () 
{ 
return (x > y) ? x : y; 
) 
Type min() 
{ 
return (x < y) ?x : y; 
) 
private: 
Type x; 
Type y; 


int main(void) 


{ 
compare<int> C1(3, 5); 
cout << "最 大 值 : " << Cl.max() << endl; 
cout << "最 小 值 : " << Cl.min() << endl; 
compare<float> C2(3.5, 3.6); 
cout << "最 大 值 : " << C2.max() << endl; 
cout << "最 小 值 : " << C2.min() << endl; 
compare<char> C3('a', 'd'); 
cout << "最 大 值 : " << C3.max() << endl; 
cout << "最 小 值 : " << C3.min() << endl; 
return 0; 

上 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 
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[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 
最 大 值 : 5 
最 小 值 : 
最 大 值 : 
最 小 值 : 
最 大 值 : 
最 小 值 : 
所 有 写 T 的 地 方 都 是 必需 的 , 每 次 定义 模板 类 的 成 员 函 数 的 时 候 , 都 需要 遵循 类 似 的 格式 (这 
里 第 二 个 工 表示 函数 返回 值 的 类 型 ， 这 个 根据 需要 可 能 会 有 变化 ) 。 
3. 模板 的 参数 值 
除了 模板 参数 前 面 跟 关键 字 class 或 typename 表示 一 个 通用 类 型 外 ,函数 模板 和 类 模板 还 可 
以 包含 其 他 不 是 代表 一 个 类 型 的 参数 ,例如 代表 一 个 常数 ， 这 些 通常 是 基本 数据 类 型 的 。 下 面 的 例 
子 定义 了 一 个 用 来 存储 数组 的 类 模板 。 
【 例 3.59】 模 板 的 参数 值 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


$9 Q Q QU 
co 





#include <iostream> 
using namespace std; 


template <class T, int N> 

class array { 
T memblock[N]; 

public: 
void setmember (int x, T value); 
T getmember (int x); 


; 


template «class T, int N» 
void array«T, N»::setmember(int x, T value) ( 
memblock[x] - value; 


template «class T, int N> 
T array«XT, N»::getmember(int x) ( 
return memblock[x]; 





int main() ( 
array «int, 5» myints; 
array «float, 5» myfloats; 
myints.setmember(0, 100); 
myfloats.setmember(3, 3.1416); 
cout << myints.getmember(0) << '\n'; 
cout << myfloats.getmember (3) << '\n'; 
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return 0; 


H 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

100 

3.1416 

我 们 也 可 以 为 模板 参数 设置 默认 值 ， 就 像 为 函数 参数 设置 默认 值 一 样 。 
下 面 是 一 些 模板 定义 的 例子 : 

template <class T> // 最 常用 的 : 一 个 class 参数 

template «class T, class U> // 两 个 class 参数 

template <class T，int N> // 一 个 class 和 一 个 整数 


template «class T = char» // 有 一 个 默认 值 
template «int Tfunc (int)» // 参数 为 一 个 函数 


4. 模板 与 多 文件 工程 

从 编译 器 的 角度 来 看 ， 模 板 不 同 于 一 般 的 函数 或 类 。 它 们 在 需要 时 才 被 编译 (compiled on 
demand) ， 也 就 是 说 一 个 模板 的 代码 直到 需要 生成 一 个 对 象 的 时 候 (instantiation)〉 才 被 编译 。 当 
需要 instantiation 的 时 候 ， 编 译 器 根据 模板 为 特定 的 调用 数据 类 型 生成 一 个 特殊 的 函数 。 

当 工 程 变 得 越 来 越 大 的 时 候 ， 程 序 代码 通常 会 被 分 割 为 多 个 源 程序 文件 。 在 这 种 情况 下 ， 通 
常 接 口 〈interface) 和 实现 〈implementation) 是 分 开 的 。 用 一 个 函数 库 做 例子 ， 接 口 通常 包括 所 有 
能 被 调用 的 函数 的 原型 定义 。 它 们 通常 被 定义 在 以 .h 为 扩展 名 的 头 文件 Cheader file) 中 ， 而 实现 
(函数 的 定义 ) 则 在 独立 的 C++ 代码 文件 中 。 

模板 这 种 类 似 宏 Cmacro-like) 的 功能 对 多 文件 工程 有 一 定 的 限制 : 函数 或 类 模板 的 实现 〈 定 
义 ) 必须 与 原型 声明 在 同一 个 文件 中 。 也 就 是 说 ， 我 们 不 能 再 将 接口 〈interface) 存储 在 单独 的 头 
文件 中 ， 而 必须 将 接口 和 实现 放 在 使 用 模板 的 同一 个 文件 中 。 

回 到 函数 库 的 例子 ， 如 果 我 们 想 要 建立 一 个 函数 模板 的 库 ， 不 能 再 使 用 头 文件 (.h) ， 取 而 代 
之 ， 应 该 生成 一 个 模板 文件 (template file) ， 将 函数 模板 的 接口 和 实现 都 放 在 这 个 文件 中 〈 这 种 
文件 没有 惯用 扩展 名 ， 除 了 不 要 使 用 .h 扩展 名 或 不 要 不 加 任何 扩展 名 ) 。 在 一 个 工程 中 ， 多 次 包含 
同时 具有 声明 和 实现 的 模板 文件 并 不 会 产生 链接 错误 (linkage errors) ， 因 为 它们 只 有 在 需要 时 才 
被 编译 ， 而 兼容 模板 的 编译 器 应 该 已 经 考虑 到 这 种 情况 ， 不 会 生成 重复 的 代码 。 


3.82 命名 空间 


1. 命名 空间 的 定义 

通过 使 用 命名 空间 (Namespaces) 可 以 将 一 组 全 局 范围 有 效 的 类 、 对 象 或 函数 组 织 到 一 个 名 
字 下 面 。 换 种 说 法 ， 就 是 它 将 全 局 范围 分 割 成 许多 子 域 范围 ， 每 个 子 域 范围 叫 作 一 个 命名 空间 。 

使 用 命名 空间 的 格式 是 : 





namespace identifier 
t 
namespace-body 
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} 


3X Hi identifier 是 一 个 有 效 的 标识 符 ，namespace-body 是 该 命名 空间 包含 的 一 组 类 、 对 象 和 函 
数 ， 例 如 : 


namespace general 
t 
int a, br 


) 
在 这 个 例子 中 ，a 和 b 是 命名 空间 general 中 的 整 型 变量 。 要 想 在 这 个 命名 空间 外 面 访问 这 两 
个 变量 ， 我 们 必须 使 用 范围 操作 符 C 。 例 如 ， 要 想 访问 前 面 的 两 个 变量 ， 需 要 这 样 写 ; 


general::a 
general::b 


命名 空间 的 作用 在 于 全 局 对 象 或 函数 很 有 可 能 重 名 而 造成 重复 定义 的 错误 , 命名 空间 的 使 用 可 
以 避免 这 些 错误 的 发 生 。 
【 例 3.60】 命 名 空间 的 简单 例子 

(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 

using namespace std; 

namespace first { 
int var = 5; 


) 


namespace second { 
double var - 3.1416; 
) 


int main() ( 
cout «« first::var «« endl; cout «« second::var «« endl; 
return 0; 


H 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

5 

3.1416 


在 这 个 例子 中 ， 两 个 都 叫 作 var 的 全 局 变量 同时 存在 ， 一 个 在 名 空间 first 下 面 定义 ， 另 一 个 
在 second 下 面 定义 ， 由 于 我 们 使 用 了 命名 空间 ， 因 此 这 里 不 会 产生 重复 定义 的 错误 。 





2. 命名 空间 的 使 用 
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使 用 using 指令 后 面 跟 namespace 可 以 将 当前 的 嵌 套 层 与 一 个 指定 的 命名 空间 连 在 一 起 ， 以 
便 使 该 命名 空间 下 定义 的 对 象 和 函数 可 以 被 访问 , 就 好 像 它们 是 在 全 局 范围 内 被 定义 的 一 样 。 它 的 
使 用 遵循 以 下 原型 定义 : 

using namespace identifier; 
【 例 3.61】 命 名 空间 的 使 用 

(D 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 

using namespace std; 

namespace first { 
int var = 5; 


) 


namespace second { 
double var = 3.1416; 
) 


int main() ( 
using namespace second; 
cout «« var «« endl; 
cout << (var * 2) << endl; 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

3.1416 

6.2832 


在 这 个 例子 的 main 函数 中 可 以 看 到 ， 我 们 能 够 直接 使 用 变量 var 而 不 用 在 前 面 加 任何 范围 操 
作 符 。 

这 里 要 注意 ,语句 using namespace 只 在 其 被 声明 的 语句 块 内 有 效 (一 个 语句 块 指 在 一 对 花 括 
号 ({}) 内 的 一 组 指令 ) ， 如 果 using namespace 是 在 全 局 范围 内 被 声明 的 ， 则 在 所 有 代码 中 都 有 
效 。 例 如 ， 想 在 一 段 程序 中 使 用 一 个 命名 空间 ， 而 在 另 一 段 程序 中 使 用 另 一 个 命名 空间 ， 则 可 以 像 
【 例 3.62】 中 那样 做 。 


【 例 3.62】 命 名 空间 的 再 次 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 

using namespace std; 

namespace first ( 
int var = 5; 
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} 


namespace second { 
double var = 3.1416; 
) 


int main() ( 

t 
using namespace first; 
cout << var «« endl; 

) 

t 
using namespace second; 
cout «« var «« endl; 

) 

return 0; 


t 
(20. 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootQlocalhost test]# ./test 

5 

3.1416 


3. 别名 定义 

我 们 可 以 为 已 经 存在 的 命名 空间 定义 别名 ， 格 式 为 : 

namespace new name = current name ; 

4. 标准 命名 空间 

我 们 能 够 找到 的 关于 命名 空间 的 最 好 的 例子 就 是 标准 C++ 函数 库 本 身 。 例 如 ANSI C++ 标准 
定义 ， 标 准 C++ 库 中 的 所 有 类 、 对 象 和 函数 都 是 定义 在 命名 空间 std 下 面 的 。 

你 可 能 已 经 注意 到 ， 本 书 忽略 了 这 一 点 。 作 者 决定 这 么 做 是 因为 这 条 规则 几乎 和 ANSI 标准 
本 身 一 样 年 轻 ， 许 多 老 一 点 的 编译 器 并 不 兼容 这 条 规则 。 

几乎 所 有 的 编译 器 ， 即 使 是 那些 与 ANSI 标准 兼容 的 编译 器 ， 都 允许 使 用 传统 的 头 文件 (如 
iostream.h、stdlib.h 等 ) ,就 像 本 书 中 所 使 用 的 一 样 。 然 而, ANSI 标准 完全 重新 设计 了 这 些 函 数 库 ， 
利用 了 模板 功能 ， 而 且 遵 循 了 这 条 规则 ， 将 所 有 的 函数 和 变量 定义 在 了 命名 空间 std 下 。 

该 标准 为 这 些 头 文件 定义 了 新 的 名 字 ， 对 针对 C++ 的 文件 基本 上 使 用 同样 的 名 字 ， 但 没有 .h 
的 扩展 名 ， 例 如 iostream.h 变 成 了 iostream。 

如 果 我 们 使 用 ANSIC++ 兼容 的 包含 文件 ， 就 必须 记 住所 有 的 函数 、 类 和 对 象 是 定义 在 命名 
空间 std 下 面 的 。 


【 例 3.63】 标 准 命名 空间 的 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 








C++ 语言 基础 第 3 党 





#include <iostream> 


// RNSI-C++ compliant hello world 
#include <iostream> 


int main() { 
std::cout << "Hello world in ANSI-C++\n"; 
return 0; 


} 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 
[root@localhost test]# g++ test.cpp -o test 


[root@localhost test]# ./test 
Hello world in ANSI-C++ 


更 常用 的 方法 是 使 用 using namespace ， 这 样 我 们 就 不 必 在 所 有 标准 空间 中 定义 的 函数 或 对 象 


前 面 使 用 范围 操作 符 CO T: 
// RNSI-C++ compliant hello world (II) 
#include «iostream» 
using namespace std; 
int main () ( 
cout << "Hello world in ANSI-C++\n"; 
return 0; 
) 
对 于 STL 用 户 ， 强 烈 建 议 使 用 ANSI-compliant 方式 来 包含 标准 函数 库 。 
3.8.8 ”异常 处 理 


1. 异常 的 定义 


本 节 介 绍 的 出 错 处 理 是 ANSI-C++ 标准 引入 的 新 功能 。 如 果 你 使 用 的 C++ 编译 器 , 不 兼容 这 


个 标准 ， 就 可 能 无 法 使 用 这 些 功能 。 


在 编程 过 程 中 ， 很 多 时 候 我 们 无 法 确定 一 段 代 码 是 否 总 是 能 够 正常 工作 ， 或 者 因为 程序 访问 





了 并 不 存在 的 资源 ， 或 者 由 于 一 些 变量 超出 了 预期 的 范围 ， 等 等 。 


这 些 情况 统称 为 出 错 (异常 》，C++ 新 近 引 入 的 3 种 操作 符 能 够 帮助 我 们 处 理 这 些 出 错 情况 : 


try、throw 和 catch。 
它们 的 一 般 用 法 是 : 


try ( 
// code to be tried 
throw exception; 
1 
catch (type exception) 
t 
// code to be executed in case of exception 
H 
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所 进行 的 操作 为 :try 语句 块 中 的 代码 被 正常 执行 .如 果 有 例外 发 生 , 代码 必须 使 用 关键 字 throw 
和 一 个 参数 来 扔 出 一 个 例外 。 这 个 参数 可 以 是 任何 有 效 的 数据 类 型 ， 它 的 类 型 反映 了 例外 的 特征 。 

如 果 有 例外 发 生 ， 也 就 是 说 在 try 语句 块 中 有 一 个 throw 指令 被 执行 了 ，catch 语句 块 就 会 被 
执行 ， 用 来 接收 throw 传 来 的 例外 参数 。 


【 例 3.64】 异 常 处 理 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
int main() ( 
char myarray[10]; 
try { 
for (int n = 0; n <= 10; n++) ( 
if (n > 9) throw "Out of range"; 
myarray[n] = 'z'; 
) 
) 
catch (char * str) ( 
cout «« "Exception: " «« str «« endl; 
) 
return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
terminate called after throwing an instance of 'char const*' 


在 这 个 例子 中 , 如 果 在 nm 循环 中 , n 变 得 大 于 9 了 ， 就 仍 出 一 个 例外 ,因为 数组 myarray[n] 在 
这 种 情况 下 会 指向 一 个 无 效 的 内 存 地 址 。 当 throw 被 执行 的 时 候 ，try 语句 块 立 即 被 停止 执行 ,在 
try 语句 块 中 生成 的 所 有 对 象 会 被 销毁 。 此 后 ， 控 制 权 被 传递 给 相应 的 catch. 语句 块 《上面 的 例子 
中 即 执行 仅 有 的 一 个 catch) 。 最 后 程序 紧 跟 着 catch 语句 块 继续 向 下 执行 ， 在 上 面 的 例子 中 就 是 
执行 return 0;. 

throw 语法 与 return 相似 ， 只 是 参数 不 需要 括 在 括号 内 。 

catch 语句 块 必须 紧 跟 在 try 语句 块 后 面 ， 中 间 不 能 有 其 他 的 代码 。catch 捕获 的 参数 可 以 是 任 
何 有 效 的 数据 类 型 。catch 甚至 可 以 被 重 载 ， 以 便 能 够 接收 不 同类 型 的 参数 。 


【 例 3.65】 多 个 catch 块 的 异常 处 理 
CD 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
int main() ( 
try ( 
char * mystring; 
mystring - new char[10]; 
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if (mystring == NULL) throw "Allocation failure"; 
for (int n = 0; n <= 100; n++) ( 
if (n» 9) throw n; 
mystring[n] = 'z'; 
H 
H 
catch (int i) ( 
cout «« "Exception: "; 
cout «« "index " «« i «« " is out of range" «« endl; 
) 
catch (char * str) { 
cout << "Exception: " << str << endl; 
} 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

Exception: index 10 is out of range 

在 上 面 的 例子 中 ， 有 两 种 不 同 的 例外 可 能 发 生 : 

要 求 的 10 个 字符 空间 不 能 够 被 赋值 (这 种 情况 很 少 ,但 是 有 可 能 发 生 ) : 这 种 情况 下 ， 扔 出 


的 例外 就 会 被 catch (char * str) 捕 获 。 


n 超过 了 mystring 的 最 大 索引 值 (index) : 这 种 情况 下 ， 扔 出 的 例外 将 被 catch (int i) 捕 获 ， 因 


为 它 的 参数 是 一 个 整 型 值 。 


我 们 还 可 以 定义 一 个 catch 语句 块 来 捕获 所 有 的 例外 , 不 论 扔 出 的 是 什么 类 型 的 参数 。 这 种 情 


况 下 ， 我 们 需要 在 catch 或 后 面 的 括号 中 写 3 个 点 来 代替 原来 的 参数 类 型 和 名 称 。 


try { 
// code here 
) 
catch (...) { 
cout «« "Exception occurred"; 
H 


try-catch 也 是 可 以 被 能 套 使 用 的 。 在 这 种 情况 下 ， 我 们 可 以 使 用 表达 式 throw; (不 带 参数 ) 将 


里 面 的 catch 语句 块 捕获 的 例外 传递 到 外 面 一 层 ， 例 如 : 


try ( 
try | 
// code here 
) 
catch (int n) ( 
throw; 
} 
b 
catch (...) { 
cout << "Exception occurred"; 


} 
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2. 没有 捕获 的 异常 

如 果 由 于 没有 对 应 的 类 型 ， 一 个 例外 没有 被 任何 catch 语句 捕获 ， 特 殊 函 数 terminate 将 被 调用 。 

这 个 函数 通常 已 被 定义 了 ， 以 便 立 即 结束 当前 的 进程 (process) ， 并 显示 一 个 “ 非 正 常 结束 ” 
(Abnormal termination) 的 出 错 信息 。 它 的 格式 是 : 


void terminate(); 

3. 标准 异常 

一 些 C++ 标准 语言 库 中 的 函数 也 会 扔 出 一 些 例外 ， 我 们 可 以 用 try 语句 来 捕获 它们 。 这 些 例 
外 扔 出 的 参数 都 是 std::exception 引申 出 的 子 类 类 型 的 。 这 个 类 (std::exception〉 被 定义 在 C++ 标 
准 头 文件 中 ， 用 来 作为 exceptions 标准 结构 的 模型 ， 如 图 3-22 所 示 。 


Exception 


bad alloc (thrown by new) 

bad cast (thrown by dynamic cast when fails with a referenced type) 
bad exception (thrown when an exception doesn't match any catch) 

bad typeid (thrown by typeid) 


logic error 
domain error 
invalid argument 
length error 
out of range 
runtime error 
overflow error 
range error 
underflow error 
ios base::failure (thrown by ios::clear) 


图 3-22 


因为 这 是 一 个 类 结构 ， 如 果 包 括 了 一 个 catch 语句 块 使 用 地 址 Creference). 来 捕获 这 个 结构 中 
的 任意 一 种 例外 (也 就 是 说 在 类 型 后 面 加 地 址 符 (&) ), 你 同时 可 以 捕获 所 有 引申 类 的 例外 CC 
的 继承 原则 ) 。 

下 面 的 例子 中 ， 一 个 类 型 为 bad_typeid 的 例外 〈exception 的 引申 类 ) ， 在 要 求 类 型 信息 的 对 
象 为 一 个 空 指针 的 时 候 被 捕获 。 


【 例 3.66】 标 准 异 常 的 例子 
(OD 打开 UE， 输 入 代码 如 下 : 








#include <iostream> 
using namespace std; 
#include <exception> 
#include <typeinfo> 


class A ( 
virtual void f() () 


; 


Nh 


int main() ( 
try ( 
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A * a = NULL; 
typeid(*a); 
} 
catch (std::exception& e) { 
cout «« "Exception: " «« e.what()««endl; 


) 
return 0; 


} 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootQlocalhost test]# ./test 
Exception: std::bad typeid 


你 可 以 用 这 个 标准 的 例外 层次 结构 来 定义 你 的 例外 或 从 中 引申 出 新 的 例外 类 型 。 


3.8.4” 预 处 理 指令 


预 处 理 指 令 是 我 们 写 在 程序 代码 中 的 给 预 处 理 器 (preprocessor〉 的 命令 ， 而 不 是 程序 本 身 的 
语句 。 预 处 理 器 在 编译 一 个 C++ 程 序 时 由 编译 器 自动 执行 ， 它 负责 控制 对 程序 代码 的 第 一 次 验证 
和 消化 。 

所 有 这 些 指令 必须 写 在 单独 的 一 行 中 ， 它 们 不 需要 加 结尾 的 分 号 (; ) 。 

1. define 

#define 可 以 被 用 来 生成 宏 定义 常量 ， 它 的 使 用 形式 是 : 














#define name value 


它 的 作用 是 定义 一 个 叫 作 name 的 宏 定 义 ， 然 后 每 当 在 程序 中 遇 到 这 个 名 字 的 时 候 ， 它 就 会 被 
value 代替 ， 例 如 : 

#define MAX WIDTH 100 

char strl[MAX WIDTH]; 

char str2[MAX WIDTH]; 

它 定 义 了 两 个 最 多 可 以 存储 100 个 字符 的 字符 串 。 

#define 也 可 以 被 用 来 定义 宏 函 数 : 

#define getmax(a,b) a>b?a:b 

int x-5, y; 

y = getmax(x,2); 

这 段 代 码 执行 后 y 的 值 为 5 。 

2. #undef 

#undef 完成 与 #define 相反 的 工作 ， 它 取消 对 传 入 的 参数 的 宏 定 义 : 

#define MAX WIDTH 100 


char strl[MAX WIDTH]; 
#undef MAX WIDTH 
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#define MAX WIDTH 200 
char str2[MAX WIDTH]; 


Jifdef. #ifndef, Zif. Zendif, else 和 #elif 指令 可 以 使 程序 的 一 部 分 在 某 种 条 件 下 被 忽略 。 

#ifdef 可 以 使 一 段 程序 只 有 在 某 个 指定 常量 已 经 被 定义 了 的 情况 下 才 被 编译 ,无 论 被 定义 的 值 
是 什么 。 它 的 操作 是 : 

#ifdef name 


// code here 
#endif 


例如 : 


#ifdef MAX WIDTH 
char str[MAX WIDTH]; 
#endif 


在 这 个 例子 中 , 语句 char st[MAX_WIDTH]; 只 有 在 宏 定 义 常量 MAX WIDTH 已 经 被 定义 的 
情况 下 才 被 编译 器 考虑 ,不管 它 的 值 是 什么 。 如 果 它 还 没有 被 定义 , 这 一 行 代 码 就 不 会 被 包括 在 程 
序 中 。 

#ifndef 起 相反 的 作用 : 在 指令 骨 fndef 和 #endif 之 间 的 代码 只 有 在 某 个 常量 没有 被 定义 的 情 
况 下 才 被 编译 ， 例 如 : 

#ifndef MAX WIDTH 

#define MAX WIDTH 100 


#endif 
char str[MAX WIDTH]; 


这 个 例子 中 ， 如 果 处 理 到 这 段 代码 的 时 候 MAX_WIDTH 还 没有 被 定义 ， 它 就 会 被 定义 为 值 
100。 而 如 果 它 已 经 被 定义 了 ， 那 么 它 会 保持 原 值 〈 因 为 #define 语句 这 一 行 不 会 被 执行 ) 。 

指令 #if、#else 和 #elif Celif = else if) 用 来 使 得 其 后 面 所 跟 的 程序 部 分 只 有 在 特定 条 件 下 才 被 
编译 。 这 些 条 件 只 能 够 是 常量 表达 式 ， 例 如 : 

#if MAX WIDTH>200 


#undef MAX WIDTH 
#define MAX WIDTH 200 


#elsif MAX WIDTH«50 
fundef MAX WIDTH 
#define MAX WIDTH 50 


#else 

#undef MAX WIDTH 
#define MAX WIDTH 100 
#endif 


char str[MAX WIDTH]; 
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注意 看 这 一 连 串 的 指令 贞 f、#kelsif 和 #else 是 怎样 以 #endif 结尾 的 。 

3. ffline 

当 我 们 编译 一 段 程序 的 时 候 ， 如 果 有 错误 发 生 ， 编 译 器 会 在 错误 前 面 显 示 出 错 文件 的 名 称 以 
及 文件 中 的 第 几 行 发 生 的 错误 。 

指令 ine 可 以 使 我 们 对 这 两 点 进行 控制 ， 也 就 是 说 当 出 错时 显示 文件 中 的 行 数 以 及 我 们 希望 
显示 的 文件 名 。 它 的 格式 是 : 

#line number "filename" 

这 里 number 是 将 会 赋 给 下 一 行 的 新 行 数 。 它 后 面 的 行 数 从 这 一 点 逐个 递增 。 

filename 是 一 个 可 选 参数 ， 用 来 蔡 换 自 此 行 以 后 出 错时 显示 的 文件 名 ， 直 到 有 另 一 个 jine 指 
令 蔡 换 它 或 直到 文件 的 末尾 ， 例 如 : 


#line 1 "assigning variable" 
int a?; 


这 段 代 码 将 会 产生 一 个 错误 ， 显 示 为 在 文件 "assigning variable", line 1 。 
4. fferror 

这 个 指令 将 中 断 编译 过 程 并 返回 一 个 参数 中 定义 的 出 错 信息 ， 例 如 : 
#ifndef | cplusplus 


#error A C++ compiler is required 
#endif 


这 个 例子 中 ， 如 果 __cplusplus 没有 被 定义 就 会 中 断 编 译 过 程 。 

5. #include 

这 个 指令 我 们 已 经 见 到 过 很 多 次 。 当 预 处 理 器 找到 一 个 #include 指令 时 ， 它 用 指定 文件 的 全 
部 内 容 蔡 换 这 条 语句 。 声 明 包含 一 个 文件 有 两 种 方式 

#include "file" 

#include «file» 

两 种 表达 的 唯一 区 别 是 编译 器 应 该 在 什么 路 经 下 寻找 指定 的 文件 。 第 一 种 情况 下 , 文件 名 被 写 
在 双 引 号 中 ,编译 器 首先 在 包含 这 条 指令 的 文件 所 在 的 目录 下 寻找 ， 如 果 找 不 到 指定 文件 , 编译 器 
再 到 被 配置 的 默认 路 径 下 《〈 也 就 是 标准 头 文件 路 径 下 ) 寻找 。 

如 果 文 件 名 是 在 尖 括 号 Co) 中 ， 编 译 器 就 会 直接 到 默认 标准 头 文件 路 径 下 寻找 。 

6. #pragma 

这 个 指令 是 用 来 对 编译 器 进行 配置 的 ， 针 对 你 所 使 用 的 平台 和 编译 器 而 有 所 不 同 。 要 了 解 更 
多 信息 ， 可 参考 编译 器 手册 。 

如 果 你 的 编译 器 不 支持 某 个 #pragma 的 特定 参数 ， 这 个 参数 会 被 忽略 ， 不 会 产生 出 错 。 


3.85 MEXE 
系统 预先 定义 了 一 些 标准 宏 供 开发 者 使 用 。 表 3-10 中 的 宏 名 称 在 任何 时 候 都 是 定义 好 的 。 
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表 3-10 AER 




















macro value 

_LINE 整数 值 ， 表 示 当 前 正在 编译 的 行 在 源 文件 中 的 行 数 

. FILE . 字符 串 ， 表 示 被 编译 的 源 文件 的 文件 名 

. DATE . 一 个 格式 为 "Mmm dd yyyy" 的 字符 串 ， 存 储 编 译 开 始 的 日 期 

_TIME — 一 个 格式 为 "hh:mm:ss" 的 字符 串 ， 存 储 编译 开始 的 时 间 

. eplusplus 整数 值 ， 所 有 C++ 编译 器 都 定义 了 这 个 常量 为 某 个 值 。 如 果 这 个 编译 器 是 完 
全 遵守 C++ 标准 的 , 它 的 值 应 该 等 于 或 大 于 199711L, 具体 值 取 决 于 它 遵守 的 
是 哪个 版 本 的 标准 





【 例 3.67】 标 准 宏 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 
// 标准 宏 名 称 

#include <iostream> 
using namespace std; 


int main() 
{ 
cout << "This is the line number " 
<< LINE ; 
cout «« " of file T << FILE 
<< ".An"; 
cout «« "Its compilation began " 
«« DATE ; 
cout < M at m se TIME <L Ann; 
cout << "The compiler gives a " 
<< " cplusplus value of " 
<< cplusplus; 
cout << endl; 
return 0; 


} 
(2) 保存 代码 为 tes.cpp, EEF] Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

This is the line number 10 of file test.cpp. 

Its compilation began Apr 7 2018 at 09:53:29. 
The compiler gives a  cplusplus value of 199711 


3.8B6 C++11 中 的 预定 义 宏 


1. BIZ func 显示 函数 名 称 
有 时 候 我 们 为 了 调试 方便 ， 想 在 某 个 函数 中 打印 出 函数 名 。C++11 提供 了 一 个 预定 义 _func__ 
(注意 两 边 各 有 两 条 下 夯 线 ) ， 用 于 表示 函数 名 称 。 该 宏 使 用 起 来 很 简单 ， 将 它 当 作 一 个 字符 串 即 
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可 ， 这 样 在 需要 打印 的 地 方 ， 按 照 字 符 串 的 打印 方式 即 可 显示 函数 名 称 。 
下 面 看 一 个 小 例子 来 加 深 理 解 。 

【 例 3.68】 使 用 宏 _func_ 得 到 函数 名 
(D 打开 UE， 输 入 代码 如 下 : 


const char *test() 

t 
return func ; 

) 

int main() 

t 
printf("$s,$s", _ func ,test()); 
return 0; 


} 

(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 
main,test 
我 们 从 test 函数 的 返回 类 型 可 以 看 出 ，_func_ 本质 上 就 是 一 个 字符 串 。 
2. 使 用 宏 _Pragma 


前 面 我 们 讲 到 了 预 处 理 指令 “#pragma"， 它 的 作用 是 向 编译 器 传达 语言 标准 以 外 的 信息 。 在 
C++11 中 引入 了 一 个 预定 义 宏 _Pragma， 它 的 功能 和 预 处 理 指令 “#pragma” 相 同 ， 基 本 用 法 如 下 : 


_Pragma (字符 趾 常量 ) 


比如 ， 前 面 提 到 为 了 防止 某 个 头 文件 被 重复 编译 ， 可 以 在 头 文件 的 开头 使 用 预 处 理 指 令 
“#pragma once”， 现 在 我 们 通过 _Pragma 也 可 以 达到 同样 的 效果 : 

_Pragma ("once") 

由 于 _Pragma 是 一 个 宏 ， 因 此 相对 于 预 处 理 指令 “#pragma” 来 说 ， 具 有 更 大 的 灵活 性 。 

3. 变 长 参数 的 宏 _VA_ARGS 

_VA_ARGS_ 是 一 个 表示 变 长 参数 的 宏 ， 它 以 前 属于 C99 标准 ， 现 在 C++11 把 它 正式 纳入 
C++ 标 准 。 变 长 参数 是 指 参数 列表 的 最 后 一 个 参数 是 省 略 号 ， 而 变 长 参数 的 宏 _VA_ARGS__ 则 可 
以 替换 省 略 号 所 代表 的 字符 串 , 这 个 功能 在 轻 量 级 调试 中 非常 有 用 , 我 们 可 以 自己 定义 一 些 日 志 函 
数 、 打 印 函数 来 丰富 调试 信息 

例如 ， 我 们 可 以 对 printf 重新 定义 ， 


#define PT(...) printf( VA ARGS ); 
然后 调用 printf 的 地 方 就 可 以 用 PT RARE: 


PT("$3d,tsWXn", 5, "abc"); 
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结果 输出 : 

5,abc 

这 样 可 以 少 打 字符 ， 提 高 效率 。 下 面 我 们 来 实现 一 个 日 志 打印 的 函数 。 
【 例 3.69】 实 现 一 个 日 志 打印 函数 

(1) 打开 UE， 输 入 代码 如 下 : 


#define DBGDUMP(...) \ 

N 
printf("$sWMn$s,$dWn", FILE , fonc BINE); N 
printf( VA ARGS ); WV 





) 


int main() 
t 
int ret = 5; 
DBGDUMP ("ret-$d Wn", ret); 


return 0; 


) 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


e:\ebook\ct+\note\code\ch03\3.70\test\test\test.cpp 

main,16 

ret=5 

首先 打印 出 源 代码 文件 名 , 然后 打印 出 函数 名 和 行 数 ， 最 后 打印 出 我 们 希望 查看 的 变量 值 。 代 
码 很 简单 ， 我 们 综合 性 地 用 到 了 前 面 介绍 的 几 个 宏 ， 它们 和 __VA_ARGS_ 一 起 较 好 地 显示 出 了 一 
些 调试 信息 ， 比 如 当前 文件 名 称 、 函 数 名 称 和 行 数 ， 以 及 自己 想 查看 的 变量 值 ， 这 里 就 是 ret。 这 
样 的 打印 信息 对 于 一 些 无 法 单 步调 试 的 环境 非常 重要 ， 比 如 内 核 调试 环境 等 。 


3.9 字符 串 


3.9.1 字符 串 基础 
字符 串 是 用 来 存储 一 个 以 上 字符 的 非 数字 值 的 变量 。 
1. string 类 
C++ 提供 一 个 string 类 来 支持 字符 串 的 操作 ， 它 不 是 一 个 基本 的 数据 类 型 ， 但 是 在 一 般 的 使 用 
中 与 基本 数据 类 型 非常 相似 。 
与 普通 数据 类 型 不 同 的 一 点 是 , 要 想 声明 和 使 用 字符 串 类 型 的 变量 , 需要 引用 头 文件 <string>， 
且 使 用 using namespace 语句 来 使 用 标准 命名 空间 Ctd) ， 如 下 面 的 例子 所 示 。 
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【 例 3.68】 第 一 个 C++ 字符 串 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
#include <string> 
using namespace std; 


int main () 


( 


String mystring - "This is a string"; 
cout << mystring««endl; 
return 0; 


) 


(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootQlocalhost test]# ./test 
This is a string 


如 上 面 的 例子 所 示 , 字符 串 变 量 可 以 被 初始 化 为 任何 字符 串 值 , 就 像 数 字 类 型 变量 可 以 被 初始 


化 为 任何 数字 值 一 样 。 
以 下 两 种 初始 化 格式 对 字符 串 变量 都 是 可 以 使 用 的 : 


string mystring = "This is a string"; 
string mystring ("This is a string"); 


字符 串 变量 还 可 以 进行 其 他 与 基本 数据 类 型 变量 一 样 的 操作 ， 比 如 声明 的 时 候 不 指定 初始 值 ， 


和 在 运行 过 程 中 被 重新 赋值 。 
【 例 3.69】 第 二 个 C++ 字符 串 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
#include <string> 
using namespace std; 


int main () 
t 
string mystring; 
mystring = 
"This is the initial string content"; 
cout «« mystring «« endl; 
mystring = 
"This is a different string content"; 
cout << mystring «« endl; 
return 0; 
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(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

This is the initial string content 

This is a different string content 


除了 使 用 string 类 外 ，C++ 程 序 中 还 能 使 用 C 风格 字符 串 。C 风格 的 字符 串 起 源 于 C 语言 ， 
并 在 C++ 中 继续 得 到 支持 。 字 符 串 实际 上 是 使 用 NULL 字符 \0' 终止 的 一 维 字符 数组 。 因 此 ， 
一 个 以 NULL 结尾 的 字符 串 包含 组 成 字符 串 的 字符 。 

下 面 的 声明 和 初始 化 创建 了 一 个 "Hello" 字符 串 。 由 于 在 数组 的 末尾 存储 了 空 字符 ， 因 此 字 
符 数 组 的 大 小 比 单词 "Hello" 的 字符 数 多 一 个 。 





char greeting[6] = ( 'H', 'e', "L", "L", 'o', 'N0']); 
依据 数组 初始 化 的 规则 ， 可 以 把 上 面 的 语句 改写 成 以 下 语句 : 
char greeting[] = "Hello"; 


其 实 ， 我 们 不 需要 把 NULL 字符 (\0') 放 在 字符 串 常量 的 末尾 。C++ 编译 器 会 在 初始 化 数 
组 时 ， 自 动 把 \0' 放 在 字符 串 的 末尾 。 下 面 的 实例 让 我 们 尝试 输出 上 面 的 字符 串 。 


【 例 3.70】 一 个 简单 字符 串 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main () 

t 
char qreootingtol = ("Hr "e" SEn SEn ou NOTI? 
cout << "Greeting message: "; 
cout << greeting << endl; 
return 0; 


H 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
Greeting message: Hello 


C++ 中 有 大 量 的 函数 用 来 操作 以 NULL 结尾 的 字符 串 ， 常 用 函数 如 表 3-11 所 示 。 





C++ 语言 基础 第 3 党 





表 3-11 常用 函数 











复制 字符 串 s2 到 字符 串 sl 
连接 字符 串 s2 到 字符 串 sl 的 末尾 
返回 字符 串 sl 的 长 度 
如 果 sl 和 s2 是 相同 的 ,就 返回 0; 如 果 sl<s2, 返 回 值 就 小 于 0; 如果 s1>s2, 
返回 值 就 大 于 0 






strcpy(sl, s2); 








strcat(sl, s2); 








strlen(s1); 





strcmp(sl, s2); 














strchr(sl, ch); | 返回 一 个 指针 ， 指 向 字符 串 sl 中 字符 ch 第 一 次 出 现 的 位 置 
strstr(s1, s2); | 返回 一 个 指针 ， 指 向 字符 串 sl 中 字符 串 s2 第 一 次 出 现 的 位 置 





下 面 的 实例 使 用 了 上 述 的 一 些 函 数 。 
【 例 3.71] 使 用 字符 串 函 数 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
#include <cstring> 


using namespace std; 


int main () 

t 
char strl[11] 
char str2[11] 
char stralli; 
int len ; 


"Hello"; 
"World"; 


// 复制 stri 到 str3 
strcpy( str3, strl); 
cout << "strcpy( str3, strl) : " << str3 << endl; 


// 连接 stri 和 str2 
sErcat( stri; str2); 
cout << "strcat( stri, SEr2): 7 << Stri << andi? 


// 连接 后 ，strl 的 总 长 度 
len = strlen(str1); 
cout << "strlen(strl) : " «« len «« endl; 


return 0; 


) 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

strcpy( str3, stri) : Hello 

strcat( strl, str2): HelloWorld 
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strlen(strl) : 10 


现在 我 们 再 回 过 头 来 看 string 类 。C++ 标 准 库 提供 了 string 类 ， 支 持 上 述 所 有 的 操作 ， 另 外 还 
增加 了 其 他 更 多 的 功能 。string 是 C++ 中 的 重要 类 型 ， 程 序 员 在 C++ 面试 中 经 常会 遇 到 关于 string 
的 细节 问题 ， 甚 至 要 求 当场 实现 这 个 类 。 只 是 由 于 面试 时 间 关 系 ， 可 能 只 要 求实 现 构造 函数 、 析 构 
函数 、 拷 贝 构造 函数 等 关键 部 分 。 所 以 大 家 平时 还 是 要 注意 对 string 知识 的 积累 。 

string 是 C++ 标准 库 的 一 个 重要 部 分 ， 主 要 用 于 字符 串 处 理 。 可 以 使 用 输入 输出 流 方式 直接 进 
行 操作 ， 也 可 以 通过 文件 等 手段 进行 操作 。 同 时 ，C++ 的 算法 库 对 string 也 有 着 很 好 的 支持 ， 而 且 
string 还 和 C 语言 的 字符 串 之 间 有 着 良好 的 接口 。 虽 然 也 有 一 些 整 端 ， 但 是 瑕 不 掩 瑜 。 

要 想 使 用 标准 C++ 中 的 string 类 ， 必 须要 包含 头 文件 string, 注意 是 string, 不 是 string.h， 带 .h 
的 是 C 语言 中 的 头 文件 。 

#include <string>// 注意 是 <string>, 不 是 <string.h>， 带 .h 的 是 c 语 言 中 的 头 文件 

using std::string; 

using std::wstring; 


或 
using namespace std; 


下 面 就 可 以 使 用 string/wstring 了 ， 它 们 分 别 对 应 着 char 和 wchar t» string 和 wstring 的 用 法 是 
一 样 的 ， 下 面 只 介绍 string 的 用 法 。 


2. 声明 C++ 字符 串 
声明 一 个 字符 串 变 量 很 简单 : 
string str; 


这 样 我 们 就 声明 了 一 个 字符 串 变 量 ， 但 既然 是 一 个 类 ， 就 有 构造 函数 和 析 构 函数 。 上 面 的 声 
明 没 有 传 入 参数 ， 所 以 就 直接 使 用 了 string 的 默认 构造 函数 ， 这 个 函数 所 做 的 就 是 把 str 初始 化 为 
一 个 空 字符 串 string 类 的 构造 函数 如 下 : 


(D strings; 生成 一 个 空 字符 串 so 

(2) strings(str) 拷贝 构造 函数 ， 生 成 str 的 复制 品 。 

(3) string s(strstridx) 将 字符 串 str 内 “ 始 于 位 置 stridx” 的 部 分 当 作 字符 串 的 初 值 。 

(4) string s(str,stridx,strlen) 将 字符 串 str 内 “ 始 于 stridx 且 长 度 顶 多 strlen ”的 部 分 作为 字符 
串 的 初 值 。 

(5) string s(cstr) 将 ec 字符 串 作为 s 的 初 值 。 

(6) string s(chars,chars_len) 将 c 字符 串 前 chars len 个 字符 作为 字符 串 s 的 初 值 。 

CD string snum,c) 生成 一 个 字符 串 ， 包 含 num c 字符 。 

(8) string s(beg,end) 以 区 间 beg:end (KEE end) 内 的 字符 作为 字符 串 s 的 初 值 。 


3. string 常用 成 员 函 数 
string 常用 成 员 函 数 如 表 3-12 所 示 。 


— 
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3€ 3-12 string 常用 成 员 函 数 
















































函数 名 描述 

begin 得 到 指向 字符 串 开头 的 Iterator 

end 得 到 指向 字符 串 结尾 的 Iterator 
rbegin 得 到 指向 反 向 字符 串 开 头 的 Iterator 
rend 得 到 指向 反 向 字符 串 结尾 的 Iterator 
Size 得 到 字符 串 的 大 小 

length 和 size 函数 功能 相同 

max size 字符 串 可 能 的 最 大 大 小 

capacity 在 不 重新 分 配 内 存 的 情况 下 ， 字 符 串 可 能 的 大 小 
empty 判断 是 否 为 空 

operator[] 取 第 几 个 元 素 ， 相 当 于 数组 

c str 取得 C 风格 的 const char* 字符 串 
data 取得 字符 串 内 容 地 址 

operator 赋值 操作 符 

reserve 预 留 空间 

swap 交换 函数 

insert 插入 字符 

append 追加 字符 

push_back 追加 字符 ， 字 符 串 之 后 插入 一 个 字符 
operator-— += 操作 符 

erase 删除 字符 串 

clear 清空 字符 容器 中 所 有 内 容 

Tesize 重新 分 配 空间 

assign 和 赋值 操作 符 一 样 

Teplace 替代 

copy 字符 串 到 空间 

find 查找 

rfind 反 向 查找 





find first of 


find first not of 


查找 包含 子 串 中 的 任何 字符 ， 返 回 第 一 个 位 置 
查找 不 包含 子 串 中 的 任何 字符 ， 返 回 第 一 个 位 置 





find last of 





查找 包含 子 串 中 的 任何 字符 ， 返 回 最 后 一 个 位 置 





find last not of 


查找 不 包含 子 串 中 的 任何 字符 ， 返 回 最 后 一 个 位 置 














substr 得 到 子 串 
compare 比较 字符 串 
operator 字符 串 链接 
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判断 是 否 相等 
operator!= | 判断 是 否 不 等 于 
判断 是 否 小 于 
从 输入 流 中 读 入 字符 串 
operator<< | 字符 串 写 入 输出 流 
从 输入 流 中 读 入 一 行 


operator—— 








operator 












operator» 














getline 








4. CETERI C 字符 串 的 转换 


C++ 提供 这 几 个 函数 data0、c_str0 和 copy0 得 到 对 应 的 C 风格 的 字符 串 ， 其 中 ，data0 以 字符 
数组 的 形式 返回 字符 串 内 容 , 但 并 不 添加 “\0”; c_str0 返 回 一 个 以 “\0” 结尾 的 字符 数组 ; 而 copy) 
则 把 字符 串 的 内 容 复 制 或 写 入 既 有 的 c string 或 字符 数组 内 。C++ 字 符 串 并 不 以 “\0” 结 尾 。 建 议 
在 程序 中 能 使 用 C++ 字符 串 就 使 用 ， 除 非 万 不 得 已 ， 否 则 不 选用 c_string。 


(1) char* 转 换 为 string 
char * 和 char str[] 类 型 可 以 直接 转换 为 string 类 型 ， 比 如 : 


char * chstr, 

char arstr[] 

string strl-chstr; 

string str2-arstr; // 可 以 直接 进行 赋值 

(2) string 转换 为 char * 

string 提供 一 个 方法 可 以 直接 返回 字符 串 的 首 指针 地 址 ， 即 string.c_str0;， 比 如 : 

string str-"Hi Cpp"; 

const char * mystr-str.c str(); // 注 意 要 加 上 const. 

5. 获取 大 小 和 容量 

一 个 C++ 字符 串 存在 3 种 大 小 : (1) 现 有 的 字符 数 , 函数 是 size() 和 length), 它们 等 效 。 Empty 
用 来 检查 字符 串 是 否 为 空 。 (2) max_size() 是 指 当前 C++ 字符 串 最 多 能 包含 的 字符 数 ， 很 可 能 和 机 
器 本 身 的 限制 或 者 字符 串 所 在 位 置 连续 内 存 的 大 小 有 关系 。 我 们 一 般 情 况 下 不 用 关心 max_size()， 
大 小 应 该 足够 我 们 使 用 。 但 是 不 够 用 的 话 ， 会 抛 出 length error 异常 。 (3) capacity() 重 新 分 配 内 存 
之 前 string 所 能 包含 的 最 大 字符 数 。 这 里 另 一 个 需要 指出 的 是 reserve0 函 数 ， 这 个 函数 为 string 重 
新 分 配 内 存 。 重 新 分 配 的 大 小 由 其 参数 决定 ， 默 认 参 数 为 0， 这 时 会 对 string 进行 非 强制 性 缩减 。 

6. 元 素 存 取 

我 们 可 以 使 用 下 标 操作 符 〈[]〉 和 函数 at0 对 元 素 包 含 的 字符 进行 访问 。 但 是 应 该 注意 的 是 ， 
操作 符 [] 并 不 检查 索引 是 否 有 效 AARI 0~str.length()) ， 如 果 索 引 失 效 ， 就 会 引起 未 定义 的 行 
为 。 而 at0 会 检查 ， 如 果 使 用 at0 的 时 候 索 引 无 效 ， 就 会 抛 出 out of range 异常 。 

有 一 个 例外 不 得 不 说 ，const string a; 的 操作 符 [] 对 索引 值 是 a.length() 仍 然 有 效 ， 其 返回 值 是 
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“\0”。 其 他 的 情况 下 ，a.length0) 索 引 都 是 无 效 的 。 举 例如 下 : 
const string Cstr("const string"); 


string Str("string"); 


Stz[3]7 //ok 
Str-at(3)7 //ok 


Str[100]; // 未 定义 的 行为 
Str.at(100); //throw out of range 


Str[Str.length ()] // 未 定义 行为 
Cstr[Cstr.length()] // 返 回 “\0” 
Str.at(Str.length());//throw out of range 
Cstr.at(Cstr.length()) ////throw out of range 


不 建议 类 似 于 下 面 的 引用 或 指针 赋值 : 


char& r-s[2]; 
char* p= &s[3]; 


因为 一 旦 发 生 重新 分 配 ，r、p 立即 失效 。 避 免 的 方法 就 是 不 使 用 。 
7. 比较 函数 





比较 (如 str<"hello") 。 在 使 用 >、>=、<、<= 操 作 符 的 时 候 、 是 根据 “当前 字符 特性 ”将 字符 按 
字典 顺序 进行 逐一 得 比较 。 字 典 排序 靠 前 的 字符 小 ， 比 较 的 顺序 是 从 前 向 后 比较 , 遇 到 不 相等 的 字 
符 ， 就 按 这 个 位 置 上 的 两 个 字符 的 比较 结果 确定 两 个 字符 串 的 大 小 。 同 时 ，string("aaaa") 
«string("aaaaa"). 

另 一 个 功能 强大 的 比较 函数 是 成 员 函 数 compare0。 它 支持 多 参数 处 理 ， 支 持 用 索引 值 和 长 度 
定位 子 串 来 进行 比较 。 它 返回 一 个 整数 来 表示 比较 结果 ， 返 回 值 意义 为 : 0 〈 相 等 ) 、>0〈 大 于 ) 、 
<0《〈 小 于 ) 。 举 例如 下 : 

string s("abcd"); 

.compare ("abcd"); // 返 回 0 


.compare ("dcba") ; // 返 回 一 个 小 于 0 的 值 
.compare ("ab"); // 返 回 大 于 0 的 值 


0o 0 0 


[2] 


.compare(s); // 相 等 
.compare(0,2,s,2,2); // 用 “ab” 和 “cd” 进 行 比较 ， 小 于 零 
s.compare (1,2, ”bcx”,2); // 用 “bc” 和 “bc” 比 较 


8. 更 改 内 容 

这 在 字符 串 的 操作 中 占 了 很 大 一 部 分 。 

首先 介绍 赋值 , 第 一 个 赋值 方法 当然 是 使 用 操作 符 “=”, 新 值 可 以 是 string (如 : s=ns)、c_string， 
(如 s-"gaint") 甚至 是 单一 字符 (如 sj 。 还 可 以 使 用 成 员 函 数 assign0， 这 个 成 员 函 数 可 以 使 


o 
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你 更 灵活 地 对 字符 串 赋值 。 下 面 举例 说 明 。 


.assign(str); 

.assign(str,1,3);// 如 果 str 是 “iamangel1”， 就 是 把 “ama” 赋 给 字符 串 
.assign(str,2,string: :npos);// 把 字符 串 str 从 索引 值 2 开 始 到 结尾 赋 给 s 
-assign("gaint"); 

.assign("nico",5);// 把 n? T ‘c” ‘0o”“\0” 赋 给 字符 串 
.assign(5,'x');// 把 5 个 x 赋 给 字符 串 


把 字符 串 清空 的 方法 有 3 个 : s=""、s.clear(); 和 s.erase();。 

string 提供 了 很 多 函数 用 于 插入 (insert) 、 删 除 (erase) 、 蔡 换 (replace) 、 增 加 字符 。 

先 介绍 增加 字符 (这 里 介绍 的 增加 是 在 末尾 ) ， 函 数 有 +=、append()、push_back()。 举 例如 下 : 
s+=str; // 加 个 字符 串 


s+="my name is jiayp";// 加 个 c 字 符 串 
s+="'a';// 加 个 字符 


s 
s 
s 
s 
s 
s 


四 


.append(str); 
„append (str, 1,3) ;// 不 解释 了 ， 同 前 面 的 函数 参数 as sign 的 解释 
.append(str,2,string::npos)//A fW FE T 


o 0 


o 


.append("my name is jiayp"); 
.append("nico",5); 
.append(5,'x'); 


o 0 


s.push_back(“a”);// 这 个 函数 只 能 增加 单个 字符 ， 对 STI 熟 悉 的 读者 理解 起 来 很 简单 


也 许 你 需要 在 string 中 间 的 某 个 位 置 插入 字符 串 , 这 时 候 可 以 用 insert() 函 数 , 这 个 函数 需要 指 
定 一 个 安插 位 置 的 索引 ， 被 插入 的 字符 串 将 放 在 这 个 索引 的 后 面 。 

s.insert(0,"my name"); 

s.insert(1l,str); 

这 种 形式 的 insertO) 函 数 不 支 持 传 入 单个 字符 ， 这 时 单个 字符 必须 写成 字符 串 形式 。 为 了 插入 
单个 字符 ，insert 函数 提供 了 两 个 对 插入 单个 字符 操作 的 重 载 函数 : insert(size_type index,size_type 
num,chart c) 和 insert(iterator pos,size_type num,chart c)。 其 中 ，size_type 是 无 符号 整数 ，iterator 是 
char*， 所 以 ， 这么 调用 insert 函数 是 不 行 的 : insert(0.1.j)， 这 时 候 第 一 个 参数 将 转换 成 哪 一 个 呢 ? 
所 以 你 必须 这 么 写 : insert((string::size_type)0,1.j)， 第 二 种 形式 指出 了 使 用 欠 代 器 安插 字符 的 形式 。 

删除 函数 erase() 和 替换 函数 replace() 的 形式 都 有 好 几 种 。 请 看 例子 : 

string s-"il8n"; 

s.replace (1, 2, "nternationalizatio");// 从 索引 1 开始 的 2 个 替换 成 后 面 的 C_string 


s.erase (13) ;// 从 索引 13 开 始 往 后 全 删除 
s.erase (7,5) ;// 从 索引 7 开始 往 后 删 5 个 


9. 提取 子 串 和 字符 串 连接 
提取 子 串 的 函数 是 ，substr()， 举 例如 下 : 
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s.substr();// 返 回 s 的 全 部 内 容 
s.substr (11) ;// 从 索引 11 往 后 的 子 串 
s.substr(5,6);// 从 索引 5 开始 的 6 个 字符 


10. 输入 输出 操作 

>>: 从 输入 流 读 取 一 个 stringo 

<<: 把 一 个 string 写 入 输出 流 。 

另 一 个 函数 就 是 getline()， 从 输入 流 读 取 一 行内 容 ， 直 到 遇 到 分 行 符 或 到 文件 尾 。 


392 ”搜索 与 查找 


以 下 所 介绍 的 所 有 string 查找 函数 都 有 唯一 的 返回 类 型 ， 那 就 是 size_type， 即 一 个 无 符号 整数 
( 按 打印 出 来 的 算 ) 。 若 查找 成 功 ， 则 返回 按 查找 规则 找到 的 第 一 个 字符 或 子 串 的 位 置 ; 若 查找 失 
败 ， 则 返回 npos， 即 -1 (打印 出 来 为 4294967295) 。 


1. find 函数 
该 函数 正 向 查找 。 声 明 如 下 : 


//string (1) 

size type find (const basic string& str, size type pos = 0) const noexcept; 
//c-string (2) 

size type find (const charT* s, size type pos - 0) const; 

//buffer (3) 

size type find (const charT* s, size type pos, size type n) const; 
//character (4) 

Size type find (charT c, size type pos - 0) const noexcept; 


[45] 3.72]. find 函数 测试 
(1) 打开 UE， 输 入 代码 如 下 : 


#include<iostream> 
#include<string> 


using namespace std; 


int main() 
{ 
cout<<"find test:"««endl; 
// 测 试 size type find (charT c, size type pos = 0) const noexcept; 
string stl("babbabab"); 
cout << stl.find('a') << endl;//1 ”由 原型 知 ， 若 省 略 第 2 个 参数 ， 则 默认 从 位 置 0( 即 
第 1 个 字符 ) 起 开始 查找 
cout << stl.find('a', 0) << end1;//1 
cout «c sti £ind('a*; 1) << endaE /T 
cout << stl.find('a', 2) << endl;//4 在 stl1 中 ， 从 位 置 2 (b， 包 括 位 置 2) 开始 查 
找 字符 a， 返 回首 次 匹配 的 位 置 ， 若 匹配 失败 ， 则 返回 npos 
cout << stl.rfind('a',7) << endl;//6 关于 rfind， 后 面 讲述 
cout << stl.find('c', 0) << end1;//4294967295 
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cout << (stl.find('c', 0) == -1) << endl;//1 

cout << (stl.find('c', 0) == 4294967295) << endl;//i1 ， 两 句 均 输出 1， 原 因 是 计 
算 机 中 -1 和 4294967295 都 表示 为 32 个 1 (二 进 制 ) 

cout << stl.find('a', 100) << endl;//4294967295 ，” 当 查找 的 起 始 位 置 超出 字符 串 
长 度 时 ， 按 查找 失败 处 理 ， 返 回 npos 

// 测 试 size type find (const basic string& str, size type pos = 0) const 
noexcept; 

string st2 ("aabcbcabcbabcc"); 

string strl("abc"); 

cout << st2.find(strl, 2) << endl;//6 从 st2 的 位 置 2 (b) 开始 匹配 ， 返 回 第 一 次 
成 功 匹配 时 匹配 的 串 〈abc) 的 首 字符 在 st2 中 的 位 置 ， 失 败 返 回 npos 

//WliXsize type find (const charT* s, size type pos = 0) const; 

cout << st2.find("abc", 2) << endl; //6 同上 ， 只 不 过 参数 不 是 string 而 是 char* 

// 测 试 size_type find (const charT* s, size type pos, size type n) const; 

cout << st2.find("abcdefg", 2, 3) << endl;//6 取 abcdefg 的 前 3 个 字符 (abc) 
参与 匹配 ， 相 当 于 st2. find ("abc"，2) 

cout << st2.find("abcbc", 0, 5) << endl;//1 相当 于 st2.find("abcbc"，0) 

cout «« st2.find("abcbc", 0, 6) «« endl;//4294967295 第 3 个 参数 超出 第 1 个 参 
数 的 长 度 时 ， 返 回 npos 


return 0; 





) 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 


find test: 
dl 


8446744073709551615 


8446744073709551615 


í"PooonBeomnenmoucstnbnwní 


18446744073709551615 
【 例 3.73】 找 出 字符 串 str 中 所 有 的 "abc" 
(1) 打开 UE， 输 入 代码 如 下 : 
// 找 出 字符 串 str 中 所 有 的 "abc" (输出 位 置 ) ， 若 未 找到 ， 则 输出 "not find!" 


#include<iostream> 
#include<string> 
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using namespace std; 


int main() 
t 
String str("babccbabcaabcccbabccabcabcabbabcc"); 
int num - 0; 
size t fi = str.find("abc", 0); 
while (fi!-str.npos) 
( 
Cout << Eq << 3 HE 
numtt; 
fi = str.find("abc", fi * 1); 
) 
if (0 == num) 
cout «« "not find!"; 
cout «« endl; 
return 0; 


H 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
bt S29 


2. rfind 函数 

rfind() 与 find0) 很 相似 , 差别 在 于 查找 顺序 不 一 样 , rfind0) 是 从 指定 位 置 起 向 前 查找 , 直到 串 首 。 
例如 ，【 例 3.72】 中 的 stl.rfind('a',7) 一 句 ， 就 是 从 stl 的 位 置 7 (stl 的 最 后 一 个 字符 b) 开始 查找 
字符 a， 第 一 次 找到 的 是 倒数 第 2 个 字符 a， 所 以 返回 6. 

函数 声明 如 下 : 


//string (1) 

size type rfind (const basic string& str, size type pos - npos) const noexcept; 
//c-string (2) 

size type rfind (const charT* s, size type pos - npos) const; 

//buffer (3) 

size type rfind (const charT* s, size type pos, size type n) const; 
//character (4) 

size type rfind (charT c, size type pos - npos) const noexcept; 


XT rfind0 不 再 举例 ， 读 者 可 根据 findO) 的 示例 自行 写 代 码 学 习 rfind()。 
3. find first of 函数 


该 函数 在 源 串 中 从 位 置 pos 起 往 后 查找 ， 只 要 在 源 串 中 遇 到 一 个 字符 , 该 字符 与 目标 串 中 任意 
一 个 字符 相同 ， 就 停止 查找 ， 返 回 该 字符 在 源 串 中 的 位 置 ， 若 匹配 失败 ， 则 返回 npos。 
函数 声明 如 下 : 


//string (1) 
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size type find first of (const basic string& str, size type pos = 0) const 
noexcept; 

//c-string (2) 

size type find first of (const charT* s, size type pos = 0) const; 

//buffer (3) 

size type find first of (const charT* s, size type pos, size type n) const; 

//character (4) 

size type find first of (charT c, size type pos - 0) const noexcept; 


[4 3.74] find first of 的 测试 
(1) 打开 UE， 输 入 代码 如 下 : 


#include<iostream> 
#include<string> 


using namespace std; 


int main() 
t 
cout<<"find first of test:"««endl; 
// 测 试 size type find first of (charT c, size type pos = 0) const noexcept; 
string str("babccbabcc"); 
cout << str.find('a', 0) << end1;//1 
cout << str.find first of('a', 0) << endl;//1  str.find first of('a', 0) 
Sjstr.find('a', 0) 
//WliXsize type find first of (const basic string& str, size type pos = 0) 
const noexcept; 
string strl("bcgjhikl"); 
string str2("kghlj"); 
cout << strl.find first of(str2, 0) << end1;// 从 str1 的 第 0 个 字符 b 开 始 找 ，b 不 
与 str2 中 的 任意 字符 匹配 ， 再 找 c，c 不 与 str2 中 的 任意 字符 匹配 ， 再 找 g，g 与 str2 中 的 g 匹 配 ， 于 是 停止 
查找 ， 返 回 g 在 str1 中 的 位 置 2 
// 测 试 size_type find first of (const charT* s, size type pos, size type n) 
const; 
cout << strl.find first of("kghlj", 0, 20);//2 尽管 第 3 个 参数 超出 了 kgh1j 的 
长 度 ， 但 仍 能 得 到 正确 的 结果 ， 可 以 认为 ，str1 是 和 "kgh1j+ 乱 码 " 做 匹配 
return 0; 
} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

find first of test: 

1 

1 

2 
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【 例 3.75】 将 字符 串 中 所 有 的 元 音字 母 换 成 * 
(1) 打开 UE， 输 入 代码 如 下 : 


#include<iostream> 
#include<string> 


using namespace std; 


int main() 
t 
std::string str("PLease, replace the vowels in this sentence by 
asterisks."); 
std::string::size type found - str.find first of("aeiou"); 
while (found != std::string::npos) 


{ 





str[found] = '*'; 

found = str.find first of("aeiou", found + 1); 
) 
std::cout << stre << a Nn 
return 0; 


} 
(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
Pleo rrrplior thA vwLo AngEbAoeo*ntknc AE DY Croke 


4. find last of 函数 
该 函数 与 find_first_ofO) 函 数 相似 ， 只 不 过 查找 顺序 是 从 指定 位 置 向 前 。 函 数 声明 如 下 : 


//string (1) 


size type find last of (const basic string& str, size type pos - npos) const 


noexcept; 
//c-string (2) 
size type find last of (const charT* s, size type pos - npos) const; 
//buffer (3) 


size type find last of (const charT* s, size type pos, size type n) const; 


//character (4) 
size type find last of (charT c, size type pos = npos) const noexcept; 


[45] 3.76] find last of 的 测试 
(1) 打开 UE， 输 入 代码 如 下 : 


#include<iostream> 
#include<string> 


using namespace std; 
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int main() 
t 
cout««"find last of test"««endl; 
// 测 试 size type find last of (const charT* s, size type pos = npos) const; 
// 目 标 串 中 仅 有 字符 c 与 源 串 中 的 两 个 c 匹 配 ， 其 余 字 符 均 不 匹配 
string str("abcdecg"); 
cout << str.find last of("hjlywkcipn", 6) << endl;//5 从 str 的 位 置 6(g) 开 
始 向 前 找 ，g 不 匹配 ， 再 找 c，c 匹 配 ， 停 止 查找 ， 返 回 c 在 stz 中 的 位 置 5 
cout << str.find last of("hjlywkcipn", 4) << endl;//2 从 str 的 位 置 4(e) 开 
始 向 前 找 ，e 不 匹配 ， 再 找 d，d 不 匹配 ， 再 找 c，c 匹 配 ， 停 止 查找 ， 返 回 c 在 str 中 的 位 置 5 
cout << str.find last of("hjlywkcipn", 200) << endl;//5 当 第 2 个 参数 超出 源 
串 的 长 度 〈( 这 里 stz 长 度 是 7) 时 ， 不 会 出 错 ， 相 当 于 从 源 串 的 最 后 一 个 字符 起 开始 查找 





return 0; 


H 
(20. 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

find last of test 

5 

2 

S 


5. find first not of 函数 

该 函数 在 源 串 中 从 位 置 pos 开始 往 后 查找 ， 只 要 在 源 串 遇 到 一 个 字符 , 该 字符 与 目标 串 中 的 任 
意 一 个 字符 都 不 相同 , 就 停止 查找 , 返回 该 字符 在 源 串 中 的 位 置 ; 若 遍 历 完整 个 源 串 都 找 不 到 满足 
条 件 的 字符 ， 则 返回 npos. 

函数 声明 如 下 : 


//string (1) 
size type find first not of (const basic string& str, size type pos - 0) const 





noexcept; 
//c-string (2) 
size type find first not of (const charT* s, size type pos - 0) const; 


//buffer (3) 
size type find first not of (const charT* s, size type pos, size type n) const; 


//character (4) 
size type find first not of (charT c, size type pos - 0) const noexcept; 


[4 3.77] find first not of 的 测试 
(1) 打开 UE， 输 入 代码 如 下 : 


#include<iostream> 
#include<string> 


using namespace std; 


int main() 
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// 测 试 size type find first not of (const charT* s, size type pos = 0) const; 

string str("abcdefg"); 

cout << str.find first not of("kiajbvehfgmlc", 0) << endl;//3 ”从 源 串 str 
的 位 置 0 (a) 开始 查找 ， 目 标 串 中 有 a《〈 匹 配 ) ， 再 找 b，b 匹 配 ， 再 找 c，c 匹 配 ， 再 找 d， 目 标 串 中 没有 aq Cf 
匹配 ) ， 停 止 查找 ， 返 回 a 在 str 中 的 位 置 3 

return 0; 


} 
(D 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
S 


6. find last not of 函数 
find last not of()*j find first not of 相似 ， 只 不 过 查找 顺序 是 从 指定 位 置 向 前 。 函 数 声明 如 


//string (1) 

size type find last not of (const basic string&str, size type pos = npos) const 
noexcept; 

//c-string (2) 

size type find last not of (const charT* s, size type pos = npos) const; 

//buffer (3) 

size type find last not of (const charT* s, size type pos, size type n) const; 

//character (4) 

Size type find last not of (charT c, size type pos = npos) const noexcept; 


函数 比较 简单 ， 这 里 不 再 袭 述 举例 。 
3.10 再 论 异常 处 理 


3.10.1 基本 概念 

异常 是 指 程序 在 运行 时 存在 异常 行为 ， 这 些 异常 的 行为 让 函数 不 能 正常 执行 。 异 常 应 该 捕获 
的 是 能 够 处 理 的 错误 ， 比 如 不 能 连接 服务 器 、 不 能 连接 数据 库 、 数 组 访问 越界 、 死 锁 、 文 件 访问 失 
败 等 情况 。 在 异常 处 理 中 , 我 们 需要 做 的 是 尽 可 能 地 修补 错误 , 让 程序 不 至 于 崩溃 ， 比 如 释放 内 存 、 
解锁 互 斥 锁 。 

C++ 异常 处 理 涉及 3 个 关键 字 : try. catch, throw. 


€ throw: 当 问 题 出 现时 ， 程 序 会 抛 出 一 个 异常 。 这 是 通过 使 用 throw. 关键 字 来 完成 的 。 
€ catch: 在 你 想 要 处 理 问题 的 地 方 ， 通 过 异常 处 理 程序 捕获 异常 。catch 关键 字 用 于 捕 
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€ try: try 块 中 的 代码 标识 将 被 激活 的 特定 异常 。 它 后 面 通常 跟着 一 个 或 多 个 catch 块 。 


如 果 有 一 个 块 抛 出 一 个 异常 , 捕获 异常 的 方法 是 使 用 try 和 catch 关键 字 。 try 块 中 放置 可 能 抛 
出 异常 的 代码 ，try 块 中 的 代码 被 称 为 保护 代码 。 使 用 try/catch 语句 的 语法 如 下 : 


try 
{ 
// 保护 代码 
}catch( ExceptionName el ) 
{ 
// catch 块 
}catch( ExceptionName e2 ) 
{ 
// catch Xt 
)catch( ExceptionName eN ) 
t 
// catch 块 
) 
如 果 try 块 在 不 同 的 情境 下 会 抛 出 不 同 的 异常 ， 这 个 时 候 可 以 尝试 罗列 多 个 catch 语句 ,用 
于 捕获 不 同类 型 的 异常 。 


3.10.2” 抛 出 异常 


可 以 使 用 throw 语句 在 代码 块 中 的 任何 地 方 抛 出 异常 。throw 语句 的 操作 数 可 以 是 任意 的 表 
达 式 ， 表 达 式 结果 的 类 型 决定 了 抛 出 异常 的 类 型 。 以 下 是 尝试 除 以 零 时 抛 出 异常 的 实例 : 
double division(int a, int b) 
i if(b--0) 
i throw "Division by zero condition!"; 
i A (a/b); 


3.10.3 ”捕获 异常 
catch 块 跟 在 try 块 后 面 ,用 于 捕获 异常 。 你 可 以 指定 想 要 捕捉 的 异常 类 型 ， 这 是 由 catch 关 
键 字 后 的 括号 内 的 异常 声明 决定 的 。 
try 
// 保护 代码 


}catch( ExceptionName e ) 


// 处 理 ExceptionName 异常 的 代码 
| 


上 面 的 代码 会 捕获 一 个 类 型 为 ExceptionName 的 异常 。 如 果 你 想 让 catch 块 能 够 处 理 try 块 抛 
出 的 任何 类 型 的 异常 ， 就 必须 在 异常 声明 的 括号 内 使 用 省 略 号 ， 如 下 所 示 : 
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try 


// 保护 代码 
)catch(...) 


// 能 处 理 任何 异常 的 代码 


下 面 是 一 个 实例 ， 抛 出 一 个 除 以 零 的 异常 ， 并 在 catch 块 中 捕获 该 异常 。 


【 例 3.78】 一 个 C++ 异常 的 例子 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


double division(int a, int b) 
( 

if( b == 0 ) 

{ 


throw "Division by zero condition!"; 


) 
return (a/b); 


) 


int main () 
{ 
int x 
int y 
double z - 0; 


try ( 
z = division(x, y); 
cout «« z «« endl; 

)catch (const char* msg) ( 
cerr << msg «« endl; 

) 


return 0; 


) 


由 于 我 们 抛 出 了 一 个 类 型 为 const char* 的 异常 ,因此 , 当 捕获 该 异常 时 ,我们 必须 在 catch 块 
中 使 用 const char*。 当 上 面 的 代码 被 编译 和 执行 时 ， 会 产生 下 列 结果 : 





Division by zero condition! 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[rootelocalhost test]# g++ test.cpp -o test 


-[root(localhost test]# ./test 
Division by zero condition! 


3.404 CH 标准 异常 


C++ 提供 了 一 系列 标准 的 异常 ， 定 义 在 <exception> 中 , 我 们 可 以 在 程序 中 使 用 这 些 标准 的 异 
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常 。 它 们 是 以 父子 类 层次 结构 组 织 起 来 的 ， 表 3-13 是 对 上 面 层 次 结构 中 出 现 的 每 个 异常 的 说 明 。 


表 3-13 异常 说 明 





























异常 描述 

std::exception 该 异常 是 所 有 标准 C++ 异常 的 父 类 

std::bad alloc 该 异常 可 以 通过 new 抛 出 

std::bad cast 该 异常 可 以 通过 dynamic cast 抛 出 

std::bad exception 这 在 处 理 C++ 程序 中 无 法 预期 的 异常 时 非常 有 用 
std::bad typeid 该 异常 可 以 通过 typeid 抛 出 

std::logic_error 理论 上 可 以 通过 读 取 代码 来 检测 到 的 异常 
std::domain_error 当 使 用 了 一 个 无 效 的 数学 域 时 ， 会 抛 出 该 异常 
std::invalid_argument 当 使 用 了 无 效 的 参数 时 ， 会 抛 出 该 异常 
std::length_error 当 创 建 了 太 长 的 std::string 时 ， 会 抛 出 该 异常 
std::out of range 该 异常 可 以 通过 方法 抛 出 ， 例 如 std:vector 和 std::bitset<>::operator[]() 
std::runtime error 理论 上 不 可 以 通过 读 取代 码 来 检测 到 的 异常 
std::overflow error 当 发 生 数 学 上 滋 时 ， 会 抛 出 该 异常 

std::range_error 当 尝 试 存储 超出 范围 的 值 时 ， 会 抛 出 该 异常 
std::underflow error 当 发 生 数 学 下 滋 时 ， 会 抛 出 该 异常 


3.10.5 ”定义 新 的 异常 
可 以 通过 继承 和 重 载 exception. 类 来 定义 新 的 异常 。 下 面 的 实例 演示 了 如 何 使 用 
std::exception 类 来 实现 自己 的 异常 。 
【 例 3.79】std::exception 类 的 简单 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
#include <exception> 
using namespace std; 


struct MyException : public exception 


| 


const char * what () const throw () 


{ 


return "C++ Exception"; 


) 
]} 


int main() 


t 


try 
t 
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throw MyException(); 
} 
catch(MyException& e) 
t 
std::cout << "MyException caught" << std::endl; 
std::cout << e.what() << std::endl; 
} 
catch(std::exception& e) 
t 
// 其 他 的 错误 
) 
) 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

MyException caught 

C++ Exception 


3.11 再 论 函数 模板 


模板 机 制 是 C++ 语言 中 引入 的 新 特性 ， 因 其 抽象 化 程度 很 高 ， 对 于 初学 者 而 言 是 一 大 难点 。 
所 以 我 们 再 次 讲述 ， 以 便 加 深 理 解 。 

模板 分 为 类 模板 和 函数 模板 ， 如 果 能 很 好 地 掌握 函数 模板 的 概念 与 使 用 ， 对 类 模板 的 理解 也 
就 顺理成章 。 所 以 大 家 首先 要 重视 函数 模板 的 学 习 。 

首先 来 看 3 个 函数 的 异同 : 

int max(int x,int y)( return (x>y) ?x:y;} 

float max(float x, float y)( return (x>y)?x:y;} 

char max(char x, char y)í return (x»y)?x:y;) 

你 会 发 现 这些 函 数 所 进行 的 操作 都 是 一 样 的 ， 所 不 同 的 仅仅 是 操作 参数 的 类 型 。 若 用 通用 的 
标识 符 T 代表 函数 的 参数 与 返回 值 类 型 ， 则 上 述 3 个 函数 可 以 统一 表示 成 这 样 的 形式 : 

T max(T x,T y) ( return (x>y)?x:y;} 

接 下 来 ， 为 我 们 熟识 的 这 位 “ 老 朋 友 ” 戴 上 一 项 “新 帽子 ”， 也 就 是 在 头 部 增加 模板 的 声明 : 

template «class T>， 得 到 的 最 终 形式 为 : 


template «class T» 

T max(T x,T y) ( return (x>y)?x:y;} 

这 便 是 一 个 完整 的 、 合 法 的 函数 模板 ， 它 的 功能 是 求 任意 类 型 的 两 个 数 中 的 较 大 者 。 之 所 以 要 
在 头 部 戴 上 一 顶 “ 新 帽子 ”， 是 要 由 关键 字 template 说 明 下 面 是 在 声明 一 个 模板 ， 关 键 字 class 或 
typename 修饰 T， 说 明 T 是 模板 的 类 型 参数 ， 代 表 一 种 通用 类 型 。 这 样 ， 大 家 可 以 容易 搞 清楚 函 
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数 模板 的 来 龙 去 脉 ,大 家 可 以 看 到 ， 函数 模板 的 实质 是 通过 类 型 的 参数 化 把 多 个 实现 相同 、 操 作 数 
类 型 不 同 的 函数 用 统一 的 模板 形式 表示 出 来 。 反 过 来 ， 如 果 用 实际 的 数据 类 型 (如 int. char 等 ) 
蔡 代 上 述 模板 中 的 类 型 参数 T， 则 可 得 到 具体 的 函数 。 通过 上 面 的 引导 过 程 ， 大 家 应 该 可 以 理解 函 
数 模板 是 一 组 函数 的 抽象 ， 是 生成 具体 函数 的 模型 、 样 板 ， 并 且 知 道 编写 函数 模板 的 语法 。 

理论 和 语法 介绍 完了 ， 下 面 来 看 实例 。 首 先 看 下 面 一 段 代码 : 


#include <iostream.h> 

template <class T> 

T max(T x,T y) (return (x»y)?x:y;! 

void main() 

t 
cout««max(5,12)««endl; //A 
cout««max(4.0,35.2)««endl; //B 
cout««max('a','f')««endl; //C 
cout««max(5,12.0)««endl; //D 
cout««max("cap","cup")««endl; //E 

) 


在 这 段 程序 中 ,一 个 实际 的 函数 调用 语句 时 ,系统 遵循 这 样 的 规则 : 首先 寻找 一 个 参数 完全 匹 
配 的 函数 ， 如 果 找 到 了 就 调用 它 ， 其 次 寻找 一 个 函数 模板 ， 把 它 实例 化 产生 一 个 匹配 的 模板 函数 ， 
然后 调用 。 
系统 使 用 函数 模板 的 过 程 包括 两 个 步骤 : 首先 推断 出 模板 的 实 参 ， 然 后 使 用 该 实 参 去 实例 化 
函数 模板 。 以 A 的 调用 代码 max(5,12) 为 例 来 说 明 函 数 模板 的 使 用 ， 大 家 可 以 看 图 3-23 的 说 明 。 
调用 表达 式 max(5，12 ) 
int int 


LEMSSCAdES 





template «class T> T max(T x.T y) 
{return (x»y)?x:y;) 


J 2. 实 例 化 


int max(int x,int y) ( retur (x»y)?x:y:) 























图 3-23 


因为 程序 中 不 存在 完全 与 之 匹配 的 具体 参数 max(int,int)， 系 统 找 到 对 应 的 函数 模板 max()， 根 
据 第 一 个 调用 参数 5 的 类 型 nt， 编译 器 推断 出 : T 必须 是 int; 根据 第 二 个 调用 参数 12 的 类 型 int， 
编译 器 又 推断 出 : T 必须 是 int。 于 是 以 int 作为 模板 实 参 实例 化 函数 模板 max(), 产生 了 模板 函数 : 

int max (int x,int y){ return (x>y) ?x:y;} 

然后 调用 它 。 行 B 和 行 C 的 调用 函数 匹配 过 程 与 此 类 似 ， 所 不 同 的 是 分 别 以 double 和 char 作 
为 模板 实 参 去 实例 化 函数 模板 。 
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模板 实 参 的 推导 过 程 需要 注意 的 是 : 推导 是 逐个 参数 进行 的 。 对 于 上 例 中 行 D 的 调用 表达 式 
max(5,12.0)， 编 译 器 根据 第 一 个 参数 5 的 类 型 是 int， 推导 出 T 必须 是 int; 而 根据 第 二 个 参数 12.0 
的 类 型 double， 推 导出 T 必须 是 double， 于 是 发 生 矛 盾 ， 编 译 器 报错 。 那 对 于 参数 类 型 不 同 怎 么 
办 呢 ? 可 以 使 用 多 个 类 型 参数 的 函数 模板 ， 即 若 程序 中 的 函数 模板 为 : 

template «class T1, class T2» 

T1 max(Tl x,T2 y) {return (x»y)?x:y;) 

W D 行 代码 可 正确 编译 通过 。 而 对 于 下 行 的 调用 max("cap","cup")， 因 为 函数 模板 中 的 比较 操作 不 
适用 于 字符 串 ， 所 以 需要 在 程序 中 为 其 提供 专门 的 版 本 : 


char *max(char*sl,char*s2)( return (strcmp(s1,s2)»0)?s1:s2;] 


相信 通过 简短 的 实例 , 大 家 能 够 明白 函数 模板 的 使 用 原理 ， 以 及 多 个 类 型 参数 模板 和 函数 模板 
的 专门 化 概念 。 


3.2 FHE 


3.12.1 计算 机 上 的 3 种 字符 集 


在 计算 机 中 ， 每 个 字符 都 要 使 用 一 个 编码 来 表示 ， 而 每 个 字符 究竟 使 用 哪个 编码 来 表示 ， 取 
决 于 使 用 哪个 字符 集 (charset) 。 

计算 机 字符 集 可 归 类 为 3 种 ， 单 字 节 字符 集 (SBCS) 、 多 字 节 字符 集 (MBCS〉 和 宽 字符 集 
CUnicode 字符 集 ) 。 


(1) 单字 节 字 符 集 (SBCS) 

SBCS (Single-Byte Character System) 的 中 文 意思 是 单字 节 字 符 集 ， 它 的 所 有 字符 都 只 有 一 个 
字 节 的 长 度 ，SBCS 是 一 个 理论 规范 。 有 具体 实现 时 有 两 种 字符 集 : ASCII 字符 集 和 扩展 ASCII 字符 
集 。 

ASCI 字符 集 主 要 用 于 美国 ， 它 由 美国 国家 标准 局 (ANSI) 颁布 ， 全 称 是 美国 国家 标准 信息 
交换 码 (American National Standard Code For Information Interchange) ， 使 用 7 位 来 表示 一 个 字符 ， 
总 共 可 以 表示 128 个 字符 〈0~127) ， 一 个 字 节 有 8 位 ， 有 一 位 不 需要 用 到 ， 因 此 人 们 把 最 高 的 一 
位 永远 设 为 0， 用 剩 下 的 7 位 来 表示 这 128 个 字符 。ASCII 字符 集 包 括 英文 字母 、 数 字 、 标 点 符号 
等 常用 字符 ， 如 字符 A 的 ASCII 码 是 65， 字 符 a 的 ASCII 码 是 97， 字 符 0 的 ASCI 码 是 48， 字 
ff 1 的 ASCII 码 是 49， 具 体 可 以 查看 ASCII 码 表 。 

在 计算 机 刚刚 在 美国 兴起 的 时 候 , ASCI 字符 集中 的 128 个 字符 够 用 了 ,一切 应 用 都 是 妥 妥 的 。 
但 后 来 计算 机 发 展 到 欧洲 ， 欧 洲 各 个 国家 的 字符 就 多 了 ，128 个 不 够 用 了 ， 怎 么 办 ? 人 们 对 ASCH 
码 进行 了 扩展 ， 因 此 就 有 了 扩展 ASCII 字符 集 ， 它 使 用 8 位 表示 一 个 字符 ， 这 样 表示 256 个 字符 ， 
在 前 面 0-127 的 范围 内 定义 与 ASCII 字符 集 相 同 的 字符 ， 后 面 多 出 来 的 128 个 字符 用 来 表示 欧洲 
国家 的 一 些 字 符 ， 如 拉丁 字母 、 希 腊 字 母 等 。 有 了 扩展 ASCII 字符 集 ， 计 算 机 在 欧洲 的 发 展 也 是 
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X. 


(2) 多 字 节 字符 集 (MBCS) 

随 着 计算 机 普及 到 更 多 国家 和 地 区 (比如 东亚 和 中 东 ) ， 由 于 这 些 国家 的 字符 更 多 ，8 位 的 单 
字 节 字符 集 (SBCS) 也 不 能 满足 信息 交流 的 需要 了 。 因 此 ， 为 了 能 够 表示 其 他 国家 的 文字 (比如 
中 文 ) ， 人 们 对 ASCI 码 继续 扩展 ， 即 英文 字母 和 欧洲 字符 为 了 和 扩展 ASC 兼容 ， 依 然 用 一 个 
字 节 表示 ， 而 对 于 其 他 各 国 自己 的 字符 〈 如 中 文字 符 ) 则 用 两 个 字 节 表示 ， 这 就 是 多 字 节 字符 集 
(Multi-Byte Character System, MBCS) ， 这 也 是 一 个 理论 规范 ， 具 体 实现 时 ， 各 个 国家 根据 自己 
的 语言 字符 分 别 各 自 实现 不 同 的 字符 集 ， 比 如 中 国 实现 了 GB-2312 字符 集 (后 来 又 扩展 出 GBK 和 
GB18030)， 日 本 实现 了 JIS 字符 集 , 等 等 。 这 些 具体 的 字符 集 虽 然 不 同 , 但 实现 依据 都 是 MBCS， 
即 256 后 面 的 字符 用 2 个 字 节 表示 。 

MBCS 解决 了 欧美 地 区 以 外 的 字符 表示 ， 但 缺点 也 是 明显 的 。MBCS 保留 原 有 扩展 ASCH 码 
(前 面 256 个 ) 的 同时 ， 用 两 个 字 节 来 表示 各 国语 言 的 语言 字符 ,这 样 就 导致 占用 一 个 字 节 和 两 个 
字 节 的 混在 一 起 ， 使 用 起 来 不 方便 。 例 如 字符 串 “ 你 好 abc”， 字 符 数 是 5， 而 字 节 数 是 8( 最 后 
还 有 一 个 0) 。 对 于 用 ++ 或 -- 运 算 符 来 遍历 字符 串 的 程序 员 来 说 ， 这 简直 就 是 焉 梦 。 另 外 ， 各 个 国 
家 、 地 区 各 自 定义 的 字符 集 难免 会 有 交集 ， 因 此 使 用 简体 中 文 的 软件 就 不 能 在 日 文 环境 下 运行 〈 显 
示 乱 码 ) 。 





(3) Unicode 编码 

Unicode 编码 是 纯 理 论 的 概念 ， 和 具体 计算 机 没关系 。 为 了 把 全 世界 所 有 的 文字 符号 都 统一 进 
行 编 码 ， 国 际 标准 化 组 织 〈International Standard Organizition, ISO) 提出 了 Unicode 编码 方案 ， 它 
是 可 以 容纳 世界 上 所 有 文字 和 符号 的 字符 编码 方案 , 这 个 方案 规定 任何 语言 中 的 任 一 字符 都 只 对 应 
一 个 唯一 的 数字 ， 这 个 数字 被 称 为 代码 点 〈Code Point) ， 或 称 码 点 、 码 位 ， 它 用 十 六 进 制 书写 ， 
并 加 上 U+ 前 缀 ， 比 如 ，“ 田 ”的 代码 点 是 U+7530; “A” 的 代码 点 是 U+0041。 再 强调 一 下 ， 代 
码 点 是 一 个 理论 的 概念 ， 和 具体 的 计算 机 无 关 。 

所 有 字符 及 其 Unicode 编码 构成 的 集合 就 叫 Unicode 字符 集 (Unicode Character Set, UCS) 。 
早期 的 版 本 有 UCS-2， 它 用 两 个 字 节 编码 ， 最 多 能 表示 65535 个 字符 。 在 这 个 版 本 中 ， 每 个 码 点 
的 长 度 有 16 位 , 这 样 可 以 用 数字 0~65535 (2 的 16 次 方 ) 来 表示 世界 上 的 字符 (当初 以 为 够 用 了 ) ， 
其 中 0-127 这 128 个 数字 表示 的 字符 依旧 跟 ASCII 完全 一 样 , 比如 Unicode 和 ASCH 中 的 数字 65, 
都 表示 字母 “A”; 数字 97 都 表示 字母 “a”。 但 反 过 来 却 是 不 同 的 ， 字 符 “A” 在 Unicode 中 的 
编码 是 0x0041， 在 ASCH 中 的 编码 是 0x41， 虽 然 它们 的 值 都 是 97， 但 编码 的 长 度 是 不 一 样 的 ， 
Unicode 码 是 16 位 长 度 ，ASCII 码 是 8 位 长 度 。 

但 UCS-2 后 来 不 够 用 了 ， 因 此 有 了 UCS-4 这 个 版 本 ，UCS-4 用 4 个 字 节 编码 (实际 上 只 用 了 
31 位 ， 最 高 位 必须 为 0， ， 它 根据 最 高 字 节 分 成 2*7=128 个 组 (最 高 字 节 的 最 高 位 恒 为 0， 所 以 有 
128 个 ) 。 每 个 组 再 根据 次 高 字 节 分 为 256 个 平面 (plane) 。 每 个 平面 根据 第 3 个 字 节 分 为 256 
行 (row), 每 行 有 256 个 码 位 (cell) 。 组 0 的 平面 0 被 称 作 基本 多 语言 平面 (Basic Multilingual Plane, 
BMP) ， 即 范围 在 U+00000000~U+0000FFFF 的 码 点 ， 如 果 将 UCS-4 的 BMP 去 掉 前 面 的 两 个 零 字 
节 ， 就 得 到 了 UCS-2 (U-0000 ~ U+FFFF) 。 每 个 平面 有 2^16=65536 个 码 位 。Unicode 计划 使 用 
了 17 个 平面 ,一 共有 17*65536=1114112 个 码 位 .在 Unicode 5.0.0 版 本 中 ,已 定义 的 码 位 只 有 238605 


EAE 
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个 ， 分 布 在 平面 0、 平面 1、 平 面 2、 平 面 14、 平 面 53、 平面 16。 其 中 ,平面 15 和 平面 16 上 只 是 
定义 了 两 个 各 占 65534 个 码 位 的 专用 区 (Private Use Area) ， 分 别 是 0xF0000~0xFFFFD 和 
0x100000~0x10FFFD。 所 谓 专 用 区 ， 就 是 保留 给 大 家 放 自 定义 字符 的 区 域 ， 可 以 简写 为 PUA。 平 
面 0 也 有 一 个 专用 区 : 0xE000~0xF8FF， 有 6400 个 码 位 。 平 面 0 的 0xD800~0xDFFF 共有 2048 个 
码 位 ， 是 一 个 被 称 作 代理 区 〈Surrogate) 的 特殊 区 域 。 代 理 区 的 目的 是 用 两 个 UTF-16 字符 表示 
BMP 以 外 的 字符 。 在 介绍 UTF-16 编码 时 会 介绍 。 

在 Unicode 5.0.0 版 本 中 ，238605-65534*2-6400-2408=99089， 余 下 的 99089 个 已 定义 码 位 分 布 
在 平面 0、 平面 1、 平 面 2 和 平面 14 上 ， 它 们 对 应 着 Unicode 目前 定义 的 99089 个 字符 ， 其 中 包 
括 71226 个 汉字 。 平面 0、 平 面 1、 平 面 2 和 平面 14 上 分 别 定义 了 52080. 3419. 43253 和 337 个 
字符 。 平 面 2 的 43253 个 字符 都 是 汉字 。 平 面 0 上 定义 了 27973 个 汉字 。 

再 归纳 总 结 一 下 : 


(1) 在 Unicode 字符 集中 的 某 个 字符 对 应 的 代码 值 称 作 代码 点 (Code Point) ， 简 称 码 点 ， 用 
16 进 制 书写 ， 并 加 上 U+ 前 级 。 比 如 ，“ 田 ”的 代码 点 是 U+7530; “A” 的 代码 点 是 U+0041。 

(2) 后 来 字符 越 来 越 多 ， 最 初 定义 的 16 位 (UC2 版 本 ) 已 经 不 够 用 了 ， 于 是 用 32 位 (UC4 
版 本 ) 表示 某 个 字符 的 代码 点 ， 并 且 把 所 有 CodePoint 分 成 17 个 代码 平面 (Code Plane) 。 其 中 ， 
U+0000 ~ U+FFFF 划 入 基本 多 语言 平面 ， 其 余 划 入 16 个 辅助 平面 (Supplementary Plane) ， 代 码 
点 范围 为 U+10000 ~ U+10FFFF。 

(3) 并 不 是 每 个 平面 中 的 代码 点 都 有 对 应 的 字符 ， 有 些 是 保留 的 ， 还 有 些 是 有 特殊 用 途 的 。 


3.12.2 BF Linux 系统 的 字符 集 

字符 集 在 Linux 系统 中 的 体现 形式 是 一 个 环境 变量 ， 以 CentOS 7 为 例 ， 其 查看 当前 终端 使 用 
字符 集 的 方式 有 以 下 几 种: 

第 1 种 查看 方式 : 


[root@localhost test]# echo $LANG 
zh CN.UTF-8 


第 2 种 查看 方式 : 





[root@localhost test]# env |grep LANG 
LANG-zh CN.UTF-8 


第 3 种 查看 方式 : 


[root@localhost test]# export |grep LANG 
declare -x LANG-"zh CN.UTF-8" 


第 4 种 查看 方式 : 
[root@localhost test]# locale 


LANG-zh CN.UTF-8 
LC CTYPE-"zh CN.UTF-8" 
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LC NUMERIC-"zh CN.UTF-8" 

LC TIME-"zh CN.UTF-8" 

LC COLLATE-"zh CN.UTF-8" 

LC MONETARY-"zh CN.UTF-8" 
LC MESSAGES-"zh CN.UTF-8" 

LC PAPER-"zh CN.UTF-8" 

LC NAME-"zh CN.UTF-8" 

LC ADDRESS-"zh CN.UTF-8" 

LC TELEPHONE-"zh CN.UTF-8" 
LC MEASUREMENT-"zh CN.UTF-8" 
LC IDENTIFICATION-"zh CN.UTF-8" 


3.12.3 ”修改 Linux 系统 的 字符 集 

值得 注意 的 是 , 如 果 默 认 语言 是 en_US.UTF-8, 在 Linux 的 字符 和 图 形 界面 下 都 是 无 法 显示 和 
输入 中 文 的 。 如 果 默 认 语 言 是 中 文 ， 比 如 zh_CN.GB18030 或 者 zh_CN.gb2312， 字 符 界面 无 法 显 
示 和 输入 ， 图 形 界面 可 以 。 

修改 的 方式 有 如 下 两 种 : 

(1) 直接 设置 变量 的 方式 修改 : 


[root@localhost test]# export LANG-zh CN.UTF-8 


(2) 修改 文件 方式 ， 通 过 修改 /etclsysconfigil8gn 文件 控制 : 





[root@Testa-www ~]# vim /etc/sysconfig/il8n 
LANG-"zh CN.UTF-8" 
[rootéTesta-www ~]# source /etc/sysconfig/il8n 


3.12.4 Unicode 编码 的 实现 


到 目前 为 止 , 关于 Unicode 都 是 在 讲理 论 层面 的 东西 , 没有 涉及 Unicode 码 在 计算 机 中 的 实现 
方式 。Unicode 的 实现 方式 和 编码 方式 不 一 定 等 价 ， 一 个 字符 的 Unicode 编码 是 确定 的 ， 但 是 在 实 
际 存储 和 传输 过 程 中 , 由 于 不 同系 统 平台 的 设计 可 能 不 一 致 , 以 及 出 于 节省 空间 的 目的 , 对 Unicode 
编码 的 实现 方式 有 所 不 同 。 Unicode 编码 的 实现 方式 称 为 Unicode 转换 格式 (Unicode Transformation 
Format, UTF) . Unicode 编码 的 实现 方式 主要 有 UTF-8, UTF-16, UTF-32 等 , 分 别 以 字 节 (BYTE) 、 
字 (WORD，2 个 字 节 ) 、 双 字 (DWORD, 4 个 字 节 ， 实 际 上 只 用 了 31 位 ， 最 高 位 恒 为 0) 作为 
编码 单位 。 根 据 字 节 序 的 不 同 ，UTF-16 可 以 被 实现 为 UTF-16LE 或 UTF-16BE，UTF-32 可 以 被 实 
现 为 UTF-32LE 或 UTF-32BE。 再 次 强调 ， 这 些 实现 方式 是 对 Unicode 码 点 进行 编码 ， 以 适合 计算 
机 的 存储 和 传输 。 

1. UTF-8 

在 UTF-8 以 字 节 为 单位 对 Unicode 进行 编码 ， 这 里 的 单位 是 程序 在 解析 二 进 制 流 时 的 最 小 单 
JG. UTF-8 中 ,程序 是 一 个 字 节 一 个 字 节 地 解析 文本 的 .从 Unicode 到 UTF-8 的 编码 方式 (对 Unicode 
码 点 进行 UTF-8 编码 ) 如 表 3-14 所 示 。 
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表 3-14 从 Unicode 到 UTF-8 的 编码 方式 


Unicode 编码 (16 进 制 ) 所 处 范围 UTF-8 字 节 流 〈 二 进 制 ) 
mm eem 


000080~0007FF llOxxxxx 10xXXXXX 
000800~00FFFF 1110xXXX lOxxxxxx 10XXXXXX 
010000~10FFFF 11110xxx 10xxxxxx IOxxxxxx 10XXXXXX 


从 表 3-14 可 以 看 出 ，UTF-8 的 特点 是 对 不 同 范围 的 字符 《〈 也 就 是 Unicode 码 点 ， 一 个 码 点 对 
应 一 个 字符 ) 使 用 不 同 长 度 的 编码 。 对 于 0x00~0x7F 之 间 的 字符 ，UTF-8 编码 与 ASCII 编码 完全 
相同 。UTF-8 编码 的 最 大 长 度 是 4 字 节 .4 字 节 模板 有 21 个 x, 即 可 以 容纳 21 位 二 进 制 数 字 。Unicode 
的 最 大 码 点 0x10FFFF 也 只 有 21 位 。 

举 个 例子 ，“ 汉 ”这 个 中 文字 符 的 Unicode 编码 是 0x6C49。0x6C49 在 0x0800 和 OXFFFF 之 
间 , 使 用 3 字 节 模板 : 1110xxxx 10xxxxxx 10xxxxxx。 将 0x6C49 写成 二 进 制 是 :0110 1100 0100 1001, 
用 这 个 比特 流 从 左 到 右 依次 代 蔡 模板 中 的 x， 得 到 : 11100110 10110001 10001001， 即 E6 B1 89. 
这 样 ，“ 汉 ”的 UTF-8 编码 就 是 E6B189。 

再 看 一 个 例子 ， 假 设 某 字符 的 Unicode 编码 为 0x20C30，0x20C30 在 0x010000 和 OxIOFFFF 
之 间 ， 使 用 4 字 节 模板 : 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx。 将 0x20C30 写成 21 位 二 进 制 数 
字 (不 足 21 位 就 在 前 面 补 0) : 000100000 1100 0011 0000， 用 这 个 比特 流 依次 代替 模板 中 的 x， 
得 到 : 11110000 10100000 10110000 10110000， 即 FO AO BO BO. 

2. UTF-16 

UTF-16 编码 以 16 位 无 符号 整数 为 单位 ， 即 把 Unicode 码 点 转换 为 16 比特 长 为 一 个 单位 的 二 
进 制 串 ， 以 用 于 数据 存储 或 传递 。 程 序 每 次 取 16 位 二 进 制 串 为 一 个 单位 来 解析 。 我 们 把 Unicode 
编码 记 作 U。 具 体 编码 规则 如 下 : 


(1) 代理 区 

因为 Unicode 字符 集 的 编码 值 范 围 为 0~0x10FFFF， 而 大 于 等 于 0x10000 的 辅助 平面 区 的 编码 
值 无 法 用 一 个 16 位 来 表示 16 位 最 多 能 表示 到 码 点 为 0xXFFFF，〉， 所 以 Unicode 标准 规定 : 基本 
多 语言 平面 内 , 码 点 范围 在 U+D800~U+DFFF 的 值 不 对 应 于 任何 字符 , 称 为 代理 区 。 这 样 , UTF-16 
利用 保留 下 来 的 0xD800~0xDFFF 区 段 的 码 点 来 对 辅助 平面 内 的 字符 的 码 点 进行 编码 。 











(2) 从 U*0000 至 U+D7FF 以 及 从 U+E000 至 U+FFFF 的 码 点 
第 一 个 Unicode 平面 的 码 点 从 U+0000 至 U+FFFF〈 除 去 代理 区 ) ， 包 含 最 常用 的 字符 。 这 个 
范围 内 的 码 点 的 UTF-16 编码 数值 等 价 于 对 应 的 码 点 ， 都 是 16 位 。 
我 们 用 U 来 表示 码 点 , 如 果 U<0x10000, U 的 UTF-16 编码 就 是 U 对 应 的 16 位 无 符号 整数 (为 
书写 简便 ， 后 文 将 16 位 无 符号 整数 记 作 WORD) 。 


(3) 从 U+10000 到 U--0FFFF 的 码 点 
辅助 平面 (Supplementary Planes) 中 的 码 点 大 于 等 于 0x10000, Æ UTF-16 中 被 编码 为 一 对 16 
比特 长 的 码 元 〈 即 32bit，4Bytes) ， 称 作 理 对 (surrogate pair) o 
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如 果 码 点 U 宇 0x10000， 先 计算 U=U-0x10000， 然 后 将 U' (注意 右上 方 有 一 个 撒 ) 写成 二 进 制 
形式 : yyyy yyyy yyxx xxxx xxxx， 接 着 在 y 前 加 上 110110， 在 x 前 加 上 110111, W U 的 UTF-16 
编码 〈 二 进 制 ) 就 是 : 110110yyyyyyyyyy 110111xxxxxxxxxx。 

为 什么 U' 可 以 被 写成 20 个 二 进 制 位 ? Unicode 的 最 大 码 点 是 0x10ffff， 减 去 0x10000 后 ，U' 
的 最 大 值 是 0xfffff, 所 以 肯定 可 以 用 20 个 二 进 制 位 表示 。 例 如 , Unicode 编码 0x20C30 减 去 0x10000 
后 ， 得 到 0x10C30， 写 成 二 进 制 是 : 0001 0000 1100 0011 0000。 用 前 10 位 依次 代替 模板 中 的 y， 
用 后 10 位 依次 代替 模板 中 的 x, 就 得 到 :1101100001000011 1101110000110000, 即 0xD843 0xDC30。 
按照 这 个 规则 ， 如 果 Unicode 编码 在 0x10000-0x10FFFF 范围 内 ，UTF-16 编码 就 有 两 个 WORD， 
第 一 个 WORD 的 高 6 位 是 110110， 第 二 个 WORD 的 高 6 位 是 110111。 可 见 ， 第 一 个 WORD 的 
取 值 范围 (二 进 制 ) 是 11011000 00000000~11011011 11111111, 即 0xD800~0xDBFF。 第 二 个 WORD 
的 取 值 范围 《二 进 制 ) 是 11011100 00000000~11011111 11111111， 即 0xDC00~0xDFFF。 它 们 和 码 
点 的 具体 对 应 关系 见 表 3-15。 





表 3-15. 和 和 码 点 的 具体 对 应 关系 


DBFF 10FCOO 10FCOI | [oF 





通过 代理 区 (Surrogate) 很 好 地 表示 了 U 宇 0x10000 的 码 点 ， 并 且 将 一 个 WORD 的 UTF-16 编 
码 与 两 个 WORD 的 UTF-16 编码 区 分 开 了 。 

我 们 把 D800~DB7F 的 范围 称 为 高 位 代理 (High Surrogates) ， 意 思 是 代理 区 中 的 D800~DB7F 
作为 两 个 WORD 的 UTF-16 编码 的 第 一 个 WORD (高 位 部 分 的 那个 WORD) ; 把 DB80~DBFF 的 
范围 称 为 高 位 专用 代理 (High Private Use Surrogates) ; 把 DC00-DFFF 的 范围 称 为 低位 代理 (Low 
Surrogates), 意思 是 代理 区 中 的 DC00~DFFF 作为 两 个 WORD 的 UTF-16 编码 的 第 二 个 WORD AR 
位 部 分 的 那个 WORD) 。 后 来 ， 由 于 高 位 代理 比 低位 代理 的 值 要 小 ， 为 了 避免 混淆 使 用 ，Unicode 
标准 现在 称 高 位 代理 为 前 导 代理 (Lead Surrogates) 。 同 样 ， 由 于 低位 代理 比 高 位 代理 的 值 要 大 ， 
因此 为 了 避免 混淆 使 用 ，Unicode 标准 现在 称 低位 代理 为 后 尾 代理 (Trail Surrogates) 。 

下 面 再 介绍 一 下 高 位 专用 代理 。 首 先 来 看 一 下 如 何 从 UTF-16 编码 推导 Unicode 编码 。 

如 果 一 个 字符 的 UTF-16 编码 的 第 一 个 WORD 的 范围 为 0xDB80 到 0xDBFF, 那么 它 的 Unicode 
编码 的 范围 是 什么 ? 我 们 知道 第 二 个 WORD 的 取 值 范围 是 pl=0xDC00-0xDFFF， 所 以 这 个 字符 的 
UTF-16 编码 范围 应 该 是 OXDB80 0xDC00~0xDBFF 0xDFFF。 我 们 将 这 个 范围 写成 二 进 制 : 


1101101110000000 11011100 00000000 - 1101101111111111 1101111111111111 
按照 编码 的 相反 步骤 ， 取 出 高 低 WORD 的 后 10 位 ， 然 后 拼 在 一 起 ， 得 到 : 
1110 0000 0000 0000 0000 - 1111 1111 1111 1111 1111 


即 0xE0000-0xFFFFF， 按 照 编码 的 相反 步骤 再 加 上 0x10000， 得 到 0xF0000-0x10FFFF。 这 就 是 
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UTF-16 编码 的 第 一 个 WORD 在 OxDB80 到 0xDBFF 之 间 的 Unicode 编码 范围 ， 即 平面 15 和 平面 
16。 由 于 Unicode 标准 将 平面 15 和 平面 16 都 作为 专用 区 ， 因 此 OxDBSO 到 OXDBFF 之 间 的 保留 码 
点 被 称 作 高 位 专用 代理 。 

下 面 讲述 一 下 UTF-16 的 字 节 序 〈 字 节 存 储 次 序 ) 问题 。 

UTF-16 的 编码 单元 是 16 位 ， 两 个 字 节 ， 这 两 个 字 节 在 传输 和 存储 过 程 中 ， 高 低位 位 置 不 同 ， 
是 不 同 的 字符 。 比如,“ 田 ” 的 UTF-16 编码 是 0x7530, 但 是 如 果 存 成 0x3075, 就 变 成 了 字符 “3”， 
成 了 另外 的 字符 。 再 比如 “ 奎 ” 的 UTF-16 编码 是 594E，“ 乙 ”的 UTF-16 编码 是 4E59， 如 果 我 
们 收 到 UTF-16 字 节 流 594E， 那 么 应 该 解释 成 “ 奎 ” 还 是 “ 乙 ”? 再 如 “ 汉 ” 字 的 Unicode 编码 是 
6C49， 那 么 写 到 文件 里 时 ， 究 竟 是 将 6C 写 在 前 面 ， 还 是 将 49 写 在 前 面 ? 

UTF-8 以 字 节 为 编码 单元 ， 没 有 字 节 序 的 问题 。UTF-16 以 两 个 字 节 为 编码 单元 ， 在 解释 一 个 
UTF-16 文本 前 , 要 弄 清楚 每 个 编码 单元 的 字 节 序 , 字 节 序 有 两 种 : 大 端 (Big Endian) 和 小 端 (Little 
Endian) ， 或 称 大 尾 和 小 尾 。 大 端 是 指 将 一 个 数 的 高 位 字 节 存储 在 起 始 地 址 ， 数 的 其 他 部 分 再 按 顺 
序 存储 ; 小 端 是 指 将 一 个 数 的 低位 字 节 存储 在 起 始 地 址 ， 数 的 其 他 部 分 再 按 顺序 存储 。 

例如 ，16 位 宽 的 数 0x1234 在 小 端 模式 CPU 内 存 中 的 存放 方式 (假设 从 地 址 0x8000 开始 存放 ) 为 : 


m XT 
CIE) mn 


而 在 大 端 模 式 的 CPU 内 存 中 的 存放 方式 则 为 : 


m ET 
fritas oa 


32 位 宽 的 数 0x12345678 在 小 端 模 式 的 CPU 内 存 中 的 存放 方式 (假设 从 地 址 0x8000 开始 存放 ) 为 : 


内 存 地 址 0x8000 0x8002 0x8003 
TEIE 


而 在 大 端 模式 的 CPU 内 存 中 的 存放 方式 则 为 : 


内 存 地 址 0x8000 0x8001 0x8002 0x8003 

大 端 和 小 端 是 由 硬件 决定 的 ， 和 操作 系统 没关系 。 通 常 x86、ARM 等 硬件 平台 都 是 小 端 。 

为 了 识别 一 个 编码 的 字 节 序 ，Unicode 标准 建议 用 BOM (Byte Order Mark) 来 区 分 字 节 序 ， 
即 在 传输 字 节 流 前 ， 先 传输 被 作为 BOM 的 字符 ， 该 字符 的 码 点 为 UHFEFF， 而 它 的 相反 FFFE 在 
Unicode 中 是 未 定义 的 码 位 ， 所 以 两 者 结合 起 来 可 以 分 别 表 示 字 节 序 ， 即 BOM 字符 在 大 端 系统 上 
的 编码 为 FEFF， 而 在 小 端 系统 上 的 编码 则 为 FFFE。 通 常 把 BOM 字符 的 编码 放 在 文件 开头 ， 如 果 
开头 是 FEFF， 就 说 明 该 文件 是 以 大 端 方式 存储 的 UTF-16 CUTF-16 大 端 可 以 写成 UTF-16BE) fii 
W: 如 果 文 件 开头 是 FFFE， 则 说 明 该 文件 是 以 小 端 方式 存储 的 UTF-16 CUTF-16 小 端 可 以 写成 
UTF-16LE) 编码 。 
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数据 传输 过 程 也 一 样 ， 如 果 接 收 者 收 到 FEFF， 就 表明 这 个 字 节 流 是 大 端的 ， 如 果 收 到 FFFE， 
就 表明 这 个 字 节 流 是 小 端的 。 

UTF-8 不 需要 BOM 来 表明 字 节 顺序 ， 但 可 以 用 BOM 来 表明 编码 方式 ，BOM 的 UTF-8 编码 
为 11101111 1011101110111111 CEFBBBF) 。 如 果 文 件 开头 是 EFBBBF， 就 说 明 该 文件 的 编码 是 
UTF-8; 如 果 接 收 者 收 到 以 EFBBBF 开头 的 字 节 流 ， 也 就 知道 这 是 UTF-8 编码 了 。 

在 Windows 的 记事 本 上 ， 选 择 “ 另 存 为 ”的 时 候 ， 用 户 可 以 选择 不 同 的 编码 选项 ， 对 应 编码 
选项 有 “ANSI” “Unicode” “Unicode big endian” 以 及 “UTF-8”。 其 中 ，“Unicode”“Unicode 
big endian ”对 应 的 分 别 是 UTF-16LE 和 UTF-16BE。 我 们 可 以 来 做 个 试验 ， 选 一 个 字 ， 比 如 “ 海 ”， 
“ 海 ” 的 码 点 是 U+6D77。 在 Windows 下 新 建 一 个 文本 文档 ， 输 入 “ 海 ”， 然 后 选择 菜单 “另存 
为 “， 在 另存 为 的 时 候选 择 编码 方式 为 “Unicode big endian ”， 接 着 关闭 文件 。 再 用 可 以 查看 二 进 
制 码 的 文本 工具 〈 比 如 UltraEdit， 注 意 最 好 用 版 本 高 一 点 的 ， 比 如 版 本 21， 版 本 太 低 只 会 显示 小 
端的 情况 ， 比 如 UltraEdit 版 本 11 就 是 这 样 的 ) ， 打 开 后 ， 选 择 二 进 制 查看 方式 ， 然 后 可 以 看 到 内 
容 为 FE FF 6D 77， 文 件 开头 的 两 个 字 节 是 FE FF， 表 示 大 端 存储 ，6D 77 就 是 “ 海 ” 的 UTF-16BE 
编码 〈 因 为 码 点 小 于 等 于 0x10000， 所 以 和 码 点 一 样 ， 因 为 是 大 端 ， 所 以 数据 的 高 位 字 节 6D 存在 
低地 址 ， 即 先 存 高 位 字 节 ) 。 以 同样 的 方式 ， 我 们 再 把 文本 文件 改 为 小 端 方 式 〈 在 记事 本 另存 为 的 
时 候选 择 编码 为 Unicode) 存储 ， 然 后 用 二 进 制 查看 ， 可 以 看 到 内 容 为 FF FE 77 6D， 文 件 开头 两 
个 字 节 为 FF FE， 表 示 小 端 存储 ，77 6D 为 UTF-16LE 编码 ， 低 位 部 分 77 存在 低地 址 ， 即 先 存 数据 
的 低位 字 节 ; 如 果 以 UTF-8 存放 ， 以 二 进 制 查看 的 时 候 就 可 以 看 到 开头 3 个 字 节 是 EFBBBF. 

3. UTF-32 

UTF-32 编码 以 32 位 无 符号 整数 为 单位 。Unicode 码 点 的 UTF-32 编码 就 是 该 码 点 值 。UTF-32 
很 简单 ， 其 编码 和 Unicode 码 点 一 一 对 应 。 根 据 字 节 序 的 不 同 ，UTF-32 也 被 实现 为 UTF-32LE 或 
UTF-32BE. BOM 字符 在 UTF-32LE CUTF-32 小 端 方 式 ) 的 编码 为 FF FE 00 00, BOM 字符 在 
UTF-32BE (UTF-32 小 端 方式 ) 的 编码 为 00 00 FE FF. 

既然 UTF-32 最 简单 ， 那 为 什么 很 多 系统 不 采用 UTF-32 呢 ? 这 是 因为 Unicode 定义 的 范围 太 
大 了 ， 实 际 使 用 中 ，99% 的 人 使 用 的 字符 编码 不 会 超过 2 个 字 节 ， 如 果 统 一 用 4 个 字 节 ， 数 据 元 余 
就 非常 大 , 会 造成 存储 上 的 浪费 和 传输 上 的 低 效 ， 因 此 16 位 是 最 好 的 。 就 算 遇 到 超过 16 位 表示 的 
字符 ， 我 们 也 可 以 通过 上 面 讲 到 的 代理 技术 ， 采 用 32 位 标识 ， 这 样 的 方案 是 最 好 的 。 不 少 主流 操 
作 系 统 实现 Unicode 方案 还 是 采用 的 UTF-16 或 UTF-8。 比 如 Windows 用 的 方案 就 是 UTF16， 而 
不 少 Linux 用 的 方案 就 是 UTF-8。 但 现在 情况 正在 发 生 改变 , 现在 好 多 新 版 本 的 主流 Linux 系统 已 
经 开始 采用 了 UTF-32 了 ， 比 如 CentOS 7。 


3.12.5 C 运行 时 库 对 Unicode 的 支持 


首先 要 记 住 宽 字 节 ， 即 wchar t 类 型 采用 Unicode 编码 方式 , 在 Windows 中 为 UTF-16, 在 
CentOS 7 中 默认 情况 下 为 UTF-32。 

C95 标准 化 了 两 种 表示 大 型 字符 集 的 方法 : 宽 字符 (wide character， 该 字符 集 内 每 个 字符 使 用 
相同 的 位 长 ) 以 及 多 字 节 字符 (multibyte character， 每 个 字符 可 以 是 一 到 多 个 字 节 不 等 ， 而 某 个 字 
节 序 列 的 字符 值 由 字符 串 或 流 (stream) 所 在 的 环境 背景 决定 ) 。 自 从 1994 年 增补 之 后 ，C 语言 
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不 止 提供 char 类 型 ， 还 提供 wchar t 类 型 〈 宽 字符 ) ， 此 类 型 定义 在 stddefh 头 文件 中 。wchar t 
指定 的 宽 字 节 类 型 足以 表示 某 个 实现 版 本 扩展 字符 集 的 任何 元 素 。 

在 多 字 节 字符 集中 ， 每 个 字符 的 编码 宽度 都 是 不 等 的 ， 可 以 是 一 个 字 节 ， 也 可 以 是 多 个 字 节 。 
源 代码 字符 集 和 运行 字符 集 都 可 能 包含 多 字 节 字符 。 多 字 节 字符 可 以 被 用 于 字符 的 常量 、 字 符 串 字 
面值 Cstring literal) ~ bkiHff (identifier) 、 注 释 (comment) 以 及 头 文件 。 

C 语言 本 身 并 没有 定义 或 指定 任何 编码 集合 或 任何 字符 集 (基本 源 代 码 字 符 集 和 基本 运行 字符 
集 除外 ) ， 而 是 由 其 实现 指定 如 何 编码 宽 字符 ， 以 及 要 支持 什么 类 型 的 多 字 节 字符 编码 机 制 。 

虽然 C 标准 没有 支持 Unicode 字符 集 ， 但 是 许多 实现 版 本 使 用 Unicode 转换 格式 UTF-16 和 
UTF-32 来 处 理 宽 字符 。 如 果 遵 循 Unicode 标准 ，wchar t 类 型 至 少 是 16 位 或 32 位 长 ， 而 wchar t 
类 型 的 一 个 值 就 代表 一 个 Unicode 字符 。 

UTF-8 是 一 个 由 Unicode Consortium. 〈 万 国 码 联盟 ) 定义 的 实现 ， 可 以 表示 Unicode 字符 集 的 
所 有 字符 。UTF-8 字符 所 使 用 的 空间 大 小 从 1 个 字 节 到 4 个 字 节 都 有 可 能 。 

多 字 节 字符 和 宽 字符 (也 就 是 wchar t) 的 主要 差异 在 于 宽 字 符 占 用 的 字 节 数目 都 一 样 ， 而 多 
字 节 字符 的 字 节 数目 不 等 ， 这 样 的 表示 方式 使 得 多 字 节 字符 串 比 宽 字符 串 更 难处 理 。 比 如 , 即使 字 
符 A 可 以 用 一 个 字 节 来 表示 ， 但 是 要 在 多 字 节 的 字符 串 中 找到 此 字符 ， 就 不 能 使 用 简单 的 字 节 比 
对 ,因为 即使 在 某 个 位 置 找到 相符 合 的 字 节 ， 此 字 节 也 不 见得 是 一 个 字符 , 它 可 能 是 另 一 个 不 同 字 
符 的 一 部 分 。 然 而 ， 多 字 节 字符 相当 适合 用 来 将 文字 存储 成 文件 。 

在 下 面 的 代码 中 ， 我 们 可 以 看 到 wchar_t 所 占用 的 字 节 数 。 





#include <stdio.h> 

int main() 

{ 
w char t ch = 'A'; //ch 占 用 4 个 字 节 
printf("sizeof(ch)-$dWMn", sizeof (ch)); 
return 0; 


) 
在 CentOS 7 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 
sizeof(ch)-4 


3.126 ”C++ 标准 库 对 Unicode 的 支持 


C++ 标准 库 中 的 string 也 有 对 应 的 宽 字符 版 本 wstring, 但 没有 提供 统一 的 函数 形式 , 不 过 可 以 
自己 定义 一 个 ， 例 如 : 


#ifdef _UNICODE 
#define tstr wstring 
#else 

#define tstr string 
#endif 
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然后 在 程序 中 使 用 tstr 即 可 。 类 似 的 还 有 fstream/wfstream、ofstream/wofstream 等 ， 都 有 两 个 
版 本 。 


3.12.7 ”字符 集 相关 实例 


【 例 3.80】 找 出 char 类 型 的 数组 里 的 汉字 
(1) 打开 UE， 输 入 代码 如 下 : 


#include "string.h" 
#include "iostream" 
using namespace std; 


int main(int argc, char* argv[]) 

t 
char szl[] = "a 世 界 ala 都 去 asdfad 哪 啦 "7 
string str; 


int i, len = strlen(sz1); // 得 到 字符 数组 长 度 


for (int i = 0; i < len;) 
t 
if (szl[il < 0)  // 若 为 负数 ， 则 前 后 两 个 字 节 存 的 是 汉字 
{ 
str.push back(szl[il); 
itt; 
str.push back(szl[i]); 
) 
itt; 
) 
cout «« str «« endl; // 输 出 找到 的 汉字 


return 0; 


) 
(2) 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[rootélocalhost test]# ./test 

世界 都 去 哪 啦 

注意 ， 若 用 SecureCRT 终端 工具 ， 则 要 把 字符 集 设 为 “简体 中 文 GB2312”， 否 则 无 法 正确 显 
示 出 中 文 。 


$48 ”Linux 文件 编程 


4.1 文件 系统 


44.1. 基本 概念 
文件 系统 是 操作 系统 中 负责 管理 和 存储 文件 的 软件 系统 。 
44.2. 文件 系统 层次 结构 标准 
当 我 们 在 Linux 下 查看 根 目录 下 的 内 容 时 , 见 到 的 目录 结构 都 大 同 小 异 ,这 是 因为 所 有 的 Linux 


发 行 版 对 根 文 件 系统 的 布局 都 遵循 文件 系统 层次 结构 标准 (File system Hierarchy Standard, FHS) 
标准 的 建议 规定 。 该 标准 规定 了 根 目录 下 各 个 子 目录 的 名 称 及 其 存放 的 内 容 ， 如 表 4-1 所 示 。 


表 4-1 根 目 录 下 各 个 子 目录 的 名 称 及 其 存放 的 内 容 











目录 名 存放 的 内 容 

/ 根 目录 ， 一 般 根 目录 下 只 存放 目录 ， 不 要 存放 文件 ，/etc、/bin、/dev、/lib、/sbin 应 该 和 根 
目录 放置 在 一 个 分 区 中 

/bin 必 备 的 用 户 命令 程序 ， 例 如 1s、cp 等 

/boot 放置 Linux 系统 启动 时 用 到 的 一 些 文件 。 比 如 ，/bootvmlinuz 为 Linux 的 内 核 文件 。 建 
议 单独 分 区 ， 分 区 大 小 100MB 即 可 

/sbin 必 备 的 系统 管理 员 命令 ， 例 如 ifconfig, reboot 等 

/dev 设备 文件 ， 例 如 mtdblock0、ttyl 等 

lete 系统 配置 文件 存放 的 目录 ， 不 建议 在 此 目录 下 存放 可 执行 文件 ， 重 要 的 配置 文件 有 /etc/inittab、 





/etc/fstab、/etc/init.d、/etc/X11、/etc/sysconfig、/etc/xinetd.d， 修 改 配 置 文件 之 前 记得 备份 。 
注 : /etc/X11 存放 与 X Windows 有 关 的 设置 

















/lib 必要 的 链接 库 ， 例 如 C 链接 库 、 内 核 模块 
/home 普通 用 户主 目录 

/root root 用 户主 目录 

/usr/bin 非 必 备 的 用 户 程序 ， 例 如 find. du^; 


/usr/sbin 非 必 备 的 管理 员 程 序 ， 例 如 chroot, inetd 等 
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目录 名 存放 的 内 容 

/var 放置 系统 执行 过 程 中 经 常 变化 的 文件 ， 如 随时 更 改 的 日 志文 件 /var/log，/var/log/message: 
所 有 的 登录 文件 存放 目录 , /var/spool/mail: 邮件 存放 的 目录 , /var/run: 程序 或 服务 启动 后 ， 
其 PID 存放 在 该 目录 下 。 建 议 单独 分 区 ， 设 置 较 大 的 磁盘 空间 

/proc 此 目录 的 数据 都 在 内 存 中 ,如 系统 核心 、 外 部 设备 、 网 络 状态 ， 由 于 数据 都 存放 于 内 存 中， 
因此 不 占用 磁盘 空间 ， 比 较 重 要 的 目录 有 /proc/cpuinfo、/proc/interrupts、/proc/dma、 
/proc/ioports、/proc/net/* 等 











/tmp 一 般 用 户 或 正在 执行 的 程序 临时 存放 文件 的 目录 ,任何 人 都 可 以 访问 ， 重 要 数据 不 可 放置 
在 此 目录 下 

/srv 服务 程序 启动 之 后 需要 访问 的 数据 目录 ， 如 www 服务 需要 访问 的 网 页 数据 存放 在 /srwwww 内 

/usr 应 用 程序 存放 的 目录 。/usr/bin 存放 应 用 程序 ，/usr/share 存放 共享 数据 ; /usr/lib 存放 不 能 


直接 运行 的 ， 却 是 许多 程序 运行 所 必需 的 一 些 函 数 库 文件 ，/usr/local 存放 软件 升级 包 ; 
/usr/share/doc 存放 系统 说 明文 件 ，/usr/share/man 存放 程序 说 明文 件 

/lib，/usr/lib， | 系统 使 用 的 函数 库 的 目录 ， 程 序 在 执行 过 程 中 ， 通 常 需 要 一 些 程序 库 的 支持 
/usr/local/lib 








42 文件 的 属性 信息 


如 何 查看 文件 类 型 的 属性 信息 呢 ? 可 以 通过 命令 ls -1 或 由 显示 的 每 行 结果 的 第 一 个 字符 来 判 
断 是 哪 种 文件 。 比 如 在 /root 下 执行 ls -1， 结 果 显 示 : 


[rootélocalhost ~]# ls -1 


总 用 量 12 
uu . 1 root root 1659 12) 16 2016 anaconda-ks.cfg 
EE —————— 1 root root 1707 12H 15 2016 initial-setup-ks.cfg 


root root 01H 27 22:03 myfile.txt 
root root 6 12H 17 2016 per15 

root root 4096 12H 9 06:49 soft 
root root 32 1] 月 3 22:11 zww 

root root 6 12H 17 2016 公共 

12H 17 2016 模板 

12H 17 2016 视频 

12H 17 2016 图 片 

12H 17 2016 文档 

12H 17 2016 F£& 


-rwxr-xr-x 1 
drwxr-xr-x. 2 
drwxr-xr-x. 5 
drwxr-xr-x. 2 
drwxr-xr-x. 2 
drwxr-xr-x. 2 root root 
drwxr-xr-x. 2 root root 
drwxr-xr-x. 2 root root 
drwxr-xr-x. 2 root root 
drwxr-xr-x. 2 root root 
drwxr-xr-x. 2 root root 12H 17 2016 音乐 
drwxr-xr-x. 2 root root 12H 17 2016 桌面 


从 第 二 行 开 始 ， 每 行 就 代表 某 个 文件 或 目录 的 属性 信息 ， 比 如 第 二 行 : 


ns . 1 root root 1659 12Ħ 16 2016 anaconda-ks.cfg 


oO000000550 
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表示 文件 anaconda-ks.cfg 的 属性 行 ( 信 息 ) ， 第 一 个 字符 就 表示 文件 类 型 ，anaconda-ks.cfg 的 
属性 行 〈 信 息 ) 的 第 一 个 字符 是 “-”， 表 示 文 件 类 型 是 普通 文件 。 文件 属性 信息 分 为 : 文件 类 型 、 
权限 、 链 接 数 、 所 属 用 户 、 所 属 用 户 组 、 文 件 大 小 、 最 后 修改 时 间 、 文 件 名 ,具体 可 以 参见 图 4-1。 


第 一 位 ， 文 件 类 型 








连接 数 MRAP MRAPA 文件 大 小 文件 最 新 修改 日 期 文件 名 
i i . i i i 
2 root root 4096 1H 12 03:44 account 


权限 的 后 3 位 :其 他 用 户 的 权限 





权限 的 前 3 位 ， 文 件 所 有 者 的 权限 
权限 的 中 辣 3 位 : 文件 所 赂 用 户 组 的 权限 


图 4-1 


43 i 节点 


4.3.1 基本 概念 


在 Linux 系统 中 ， 内 核 为 每 一 个 新 创建 的 文件 分 配 一 个 i 节点 (索引 节点 ，index node) . X 
件 的 属性 信息 就 保存 在 索引 节点 里 , 在 访问 文件 时 ,索引 节点 被 复制 到 内 存 中 ， 从 而 实现 文件 的 快 
速 访问 。 索 引 节点 是 Linux 虚拟 文件 系统 (Virtual File Systems, VFS) 的 基本 概念 之 一 。 

i 节点 不 但 包含 某 个 文件 的 属性 信息 ， 还 包含 指向 存储 文件 数据 的 数据 块 的 指针 。 在 Linux X 
件 系统 中 ,一 个 文件 除了 纯 数 据 本 身 之 外 ,还 必须 包含 对 这 些 纯 数据 的 管理 信息 ， 如 访问 权限 、 文 
件 的 属 主 以 及 该 文件 的 数据 所 对 应 的 磁盘 块 等 ,这些 管理 信息 称 为 元 数据 (mata data) ， 保 存在 文 
件 的 i 节点 之 中 。 

我 们 以 硬盘 存储 文件 来 说 明 ， 文 件 储存 在 硬盘 上 ， 硬 盘 的 最 小 存储 单位 叫 作 “ 扇 区 ”。 每 个 
扇 区 能 存储 512 字 节 。 操 作 系统 在 读 取 硬 盘 的 时 候 ， 不 会 一 个 个 扇 区 地 读 取 ， 这 样 效 率 太 低 ， 而 是 
一 次 性 连续 读 多 个 扇 区 ， 即 一 次 性 读 取 一 个 “ 块 ” (block) 。 这 种 由 多 个 扇 区 组 成 的 “ 块 ” 是 文 
件 存 取 的 最 小 单位 。“ 块 ”的 大 小 最 常见 的 是 4KB， 即 连续 8 个 扇 区 组 成 一 个 块 。 文 件 纯 数据 都 
存放 在 “ 块 ” 中， 很 显然 ， 我 们 还 必须 找到 一 个 地 方 来 存储 文件 的 元 数据 ， 比 如 文件 的 创建 者 、 文 
件 的 创建 日 期 、 文 件 的 大 小 等 。 这 种 存储 文件 元 数据 的 区 域 就 叫 作 ii 节点。 通常 ,在 一 个 Linux 系 
统 中 ，i 节点 所 占 空间 大 约 是 整个 文件 系统 空间 的 1%。 在 Linux 系统 中 ， 一 个 磁盘 被 格式 化 为 ext 
文件 系统 (比如 ext2 BÈ ext3) 时， 系统 将 自动 生成 一 个 i 节点 表 〈i 节点 数组 ) ， 并 且 每 个 文件 都 
对 应 着 一 个 i 节点。 创建 一 个 文件 后 ， 会 同时 创建 一 个 站 节点 和 一 个 “ 块 ”，i 节点 存放 的 是 文件 
的 属性 信息 〈 但 是 不 包括 文件 名 ) ， 并 存放 所 对 应 数据 所 在 的 “ 块 ” 的 地 址 的 指针 ; “ 块 ” 存放 文 
件 的 真正 数据 ， 每 个 “ 块 ” 最 多 存放 一 个 文件 ， 而 当 一 个 “ 块 ” 存放 不 下 时 ， 会 占用 下 一 个 “ 块 ”。 


43.2 i 节点 的 内 容 
i 节点 包含 文件 的 元 数据 ， 具 体 来 说 主要 有 以 下 内 容 : 





Linux C 与 C++ 一 线 开发 实践 





(D i 节点 号 (inode-no) ， 在 一 个 文件 系统 中 ， 每 个 节点 都 有 一 个 唯一 的 编号 。 

(2) 文件 类 型 (filetype) ， 比 如 字符 “-” 表 示 普 通 文件 ， 字 符 “d” 表 示 目 录 ， 等 等 。 

(3) BUR (permission) ， 权 限 分 为 可 读 权 限 、 可 写 权 限 、 可 执行 权限 等 ， 系 统 使 用 一 组 数字 
来 表示 某 个 文件 或 目录 的 权限 ， 这 是 因为 用 数字 表示 权限 比 用 符号 表示 权限 占用 的 存储 空间 少 。 

(4) 文件 的 字 节 数 。 

(5) 文件 的 拥有 者 uid. 

(6) 文件 的 所 属 组 gido 

CD) 文件 的 时 间 戳 ， 时 间 戳 又 包含 3 个 时 间 : 


(D ctime (change time) 表示 文件 的 i 节点 上 一 次 变动 的 时 间 。 
Q) mtime (modify time) 表示 文件 内 容 上 一 次 变动 的 时 间 。 
(3) atime (access time) 表示 文件 上 一 次 访问 〈 内 容 没 有 变动 ) 的 时 间 。 


(8) 硬 链接 数 ， 稍 后 会 讲 到 。 

(9) 存 有 文件 纯 数据 的 “ 块 ”的 位 置 ， 即 真正 存放 文件 数据 的 数据 块 的 指针 。 

细心 的 朋友 可 能 会 发 现 ， 为 什么 i 节点 里 不 包含 文件 名 ? 的 确 ，i 节点 不 包含 文件 名 。 每 个 i 
节点 都 有 一 个 i 节点 号 ， 操 作 系 统 是 通过 用 i 节点 号 来 识别 文件 的 ， 而 不 是 通过 文件 名 来 识别 文件 
的 ， 文件 名 是 给 和 信用 的 。 虽 然 每 个 文件 对 应 唯一 的 i 节点 号 ,但 i 节点 号 是 杂乱 而 毫 无 意义 的 ， 不 
方便 人 记忆 和 使 用 , 用 户 希望 对 每 个 文件 取 一 个 有 意义 的 文件 名 。 现代 文件 系统 提供 的 一 个 基本 功 
能 是 按 名 存 取 ,所 以 还 需要 建立 文件 名 到 i 节点 号 的 对 应 关系 , 这 就 引出 了 目录 项 (directory entry, 
HI dentry) 的 概念 。 在 Linux 文件 系统 中 有 一 类 特殊 的 文件 称 为 “目录 ”， 目 录 就 保存 了 该 目录 下 
所 有 文件 的 文件 名 到 i 节点 号 的 对 应 关系 ， 这 里 的 每 个 对 应 关系 就 称 为 一 个 目录 项 。Linux 把 所 有 
的 文件 和 目录 构建 成 了 一 个 倒立 的 树 状 结构 ， 这 样 只 要 确定 了 根 目录 的 i 节 点 号 ， 就 可 以 对 整个 文 
件 系统 进行 按 名 存 取 。 再 次 强调 ， 文 件 名 保存 在 一 个 目录 项 中 。 每 一 个 目录 项 中 都 包含 文件 名 和 i 
节点 。 我 们 可 以 通过 图 4-2 来 看 一 下 目录 项 、i 节点 之 间 的 联系 。 




















图 4-2 


从 图 4-2 中 可 以 看 出 目录 是 一 种 表 ， 而 每 一 行 即 为 一 个 目录 项 ,每 个 目录 项 都 包含 一 个 i 节点 
号 和 一 个 文件 名 ，i 节点 号 指向 i 节点 。 这 样 我 们 就 可 以 通过 文件 名 找到 节点 号 ， 通 过 i 节点 号 找 
到 i 节点， 从 而 找到 文件 在 磁盘 上 的 位 置 。 表面 上 用 户 通过 文件 名 打开 文件 ， 实 际 上 系统 内 部 这 个 
过 程 分 为 3 步 : 


:252* 
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(1) 系统 通过 目录 项 找到 这 个 文件 名 对 应 的 i 节点 号 。 
(2) 通过 i 节点 号 获取 i 节点 信息 。 
G) 根据 i 节点 信息 找到 文件 数据 所 在 的 “ 块 ”， 读 出 数据 。 


我 们 可 以 用 ls -i 来 查看 文件 所 对 应 的 i 节点 号 ， 比 如 : 





[root@localhost ~]# ls -i myfile.txt 
67230464 myfile.txt 


67230464 就 是 myfile.txt 的 i 节点 号 。 也 可 以 用 stat 命令 来 查看 某 个 文件 的 i 节点 号 ， 如 下 : 


[root@localhost ~]# stat myfile.txt 
文件 : "myfile.txt" 
大 小 : 0 块 : 0 IO 块 : 4096 ”普通 空 文件 
设备 : f300n/64768d Inode: 67230464 硬 链接 : 1 
权限 : (0755/-rwxr-xr-x) Uid: ( 0/ root) Gid: ( 0/ root) 
最 近 访 问 : 2018-01-27 22:03:59.006601572 +0800 
最 近 更 改 : 2018-01-27 22:03:59.006601572 +0800 
最 近 改 动 : 2018-01-27 22:03:59.006601572 +0800 
创建 时 间 : - 


可 以 看 到 ,除了 i 节点 号 外 ,其 他 的 属性 信息 也 都 显示 出 来 了 。 如 果 要 查看 某 目录 下 的 所 有 文 
件 的 i 节点 号 ， 可 用 命令 ls -li， 如 下 : 


[rootélocalhost ~]# ls -li 


总 用 量 12 
74593456 . 1 root root 1659 12Ħ 16 2016 anaconda-ks.cfg 
72621286 1 root root 1707 12H 15 2016 initial-setup-ks.cfg 





root root 0 1H 27 22:03 myfile.txt 
root root 0 2H 18 18:14 newfile.dat 
root root 6 12H 17 2016 per15 

root root 4096 12H 9 06:49 soft 

root root 32 11H 3 22:11 zww 

12] 17 2016 公共 

12H 17 2016 模板 

12H 17 2016 视频 

12H 17 2016 EDT 

12H 17 2016 文档 

12H 17 2016 下 载 

12H 17 2016 音乐 

12H 17 2016 桌面 


67230464 -rwxr-xr-x 1 

67230504 -rw-r--r-- 1 

39782649 drwxr-xr-x. 2 

102575654 drwxr-xr-x. 5 

72630749 drwxr-xr-x. 2 

104214069 drwxr-xr-x. 2 root root 
72621302 drwxr-xr-x. 2 root root 

104214070 drwxr-xr-x. 2 root root 
72621303 drwxr-xr-x. 2 root root 
6224821 drwxr-xr-x. 2 root root 
39782647 drwxr-xr-x. 2 root root 
39782648 drwxr-xr-x. 2 root root 
6224820 drwxr-xr-x. 2 root root 


4.3.8 i 节点 的 使 用 状 ; 
点 的 大 小 一 般 是 128 字 节 或 256 字 节 。i 节点 的 总 数 在 格式 化 时 就 会 给 定 ， 一 般 是 每 
IKB 或 每 2KB 就 设置 一 个 i 节点 。 

查看 每 个 硬盘 分 区 的 i 节点 总 数 和 已 经 使 用 的 数量 可 以 使 用 df 命令 。 我 们 每 次 新 建 一 个 文件 ， 
可 用 i 节点 的 数目 就 会 减 1， 已 用 i 节点 数目 就 会 增加 1， 通 过 df -i 命令 可 以 查看 到 这 一 点 ， 这 个 
命令 可 以 用 来 查看 当前 文件 系统 的 i 节点 的 使 用 情况 ， 如 下 : 


^oo0o9?0o6020 
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[root@localhost ~]# df -i 
文件 系统 


devtmpfs 118950 
tmpfs 125962 
tmpfs 125962 
tmpfs 125962 
/dev/mapper/centos-root 81027072 
/dev/sdal 512000 
tmpfs 125962 
tmpfs 125962 


Inode CH (1) 


可 用 (I) 已 用 (IT)s HAS 


370 118580 1$ /dev 

T5 125947 1% /dev/shm 

568 125394 1% /run 

13 125949 1% /sys/fs/cgroup 
449567 80577505 1$ / 

381  Á 511619 1$ /boot 

24 125935 1% /run/user/0 
37 125925 1% /run/user/1000 


可 以 看 到 ， 当 前 /dev/mapper/centos-root 的 可 用 i 节点 数 为 80577505, GH i WARO 449567. 
下 面 在 /root 下 新 建 一 个 文件 ， 然 后 用 df -i 查看 : 


[root@localhost ~]# touch newfile.dat 


[root@localhost ~]# df -i 
文件 系统 


devtmpfs 118950 
tmpfs 125962 
tmpfs 125962 
tmpfs 125962 
/dev/mapper/centos-root 81027072 
/dev/sdal 512000 
tmpfs 125962 
tmpfs 125962 


Inode 已 用 (I) 


可 用 (I) 已 用 (I)% ERA 


370 118580 1$ /dev 

15 125947 1$ /dev/shm 

577 125385 1$ /run 

13 125949 1% /sys/fs/cgroup 
449568 80577504 18 / 

381 511619 1$ /boot 

27 125935 1$ /run/user/0 
37 125925 1$ /run/user/1000 


可 以 看 到 ， 新 建 了 文件 newfile.dat Ji, /dev/mapper/centos-root 的 可 用 i 节点 数 减 1， 变 为 
80577504， 可 用 的 i 节点 数 增加 1， 变 为 449568。 


4.4 


文件 类 型 


在 Linux 系统 中 ， 可 以 说 一 切 皆 文件 。 我 们 看 到 的 目录 和 外 设 〈 如 光驱 、U 盘 、 硬 盘 等 ) 都 是 
以 文件 的 形式 存在 的 。 在 Linux 中 有 7 种 文件 类 型 : 普通 文件 、 目 录 、 块 设备 文件 、 字 符 设 备 文件 、 
链接 文件 、 管 道 文件 、 套 接口 文件 。 针 对 这 7 种 文件 类 型 ， 分 别 有 相 应 的 字符 来 表示 。 


-: 普通 文件 。 
目录 。 


: 链接 文件 . 
p: 管道 文件 。 


XH). 


d: 

b: 块 设备 文件 (例如 硬 盘 、 光 驱 等 ) 。 

c: 字符 设备 文件 (例如 “ 猫 ” 等 串口 设备 ) 。 
1 


s: 套 接口 文件 /数据 接口 文件 ( 例如 启动 一 个 MySQL 服务 器 时 会 产生 一 个 mysql.sock 
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这 里 只 需 关 注 第 一 个 字符 〈 即 文件 类 型 ) 即 可 ， 其 他 属性 暂且 不 介绍 。 顺 便 介 绍 一 下 11 A ls- 
的 区 别 : 1 会 显示 出 当前 目录 下 的 隐藏 文件 ， 而 ls -1 不 会 。 


44.4 普通 文件 


普通 文件 中 包含 的 内 容 就 是 用 户 、 系 统 或 应 用 程序 输入 而 生成 的 数据 ， 在 文件 系统 中 不 加 任 
何 内 部 修饰 ， 把 它们 看 作 纯 粹 的 字 节 流 。 我 们 可 以 用 命令 ls -1 或 1 来 查看 文件 的 属性 信息 ， 通 过 
判断 属性 行 的 第 一 个 字符 来 判断 文件 的 类 型 ， 如 果 第 一 个 字符 是 “-”， 就 表示 是 一 个 普通 文件 。 
比如 我 们 在 /root 下 运行 1 命令 : 


[root@localhost ~]# 11 


总 用 量 12 
EW root root 1659 12)] 16 2016 anaconda-ks.cfg 
cg root root 1707 12)] 15 2016 initial-setup-ks.cfg 


root root 0 1H 27 22:03 myfile.txt 
root root 6 12H 17 2016 per15 

root root 4096 12H 9 06:49 soft 
root root 32 11 月 3 22:11 zww 


-rWXI-XI-X 

drwxr-xr-x. 
drwxr-xr-x. 
drwxr-xr-x. 


NNNNNNNNNONP pp 


drwxr-xr-x. 2 root root 6 12H 17 2016 公共 
drwxr-xr-x. 2 root root 6 12H 17 2016 模板 
drwxr-xr-x. 2 root root 6 12H 17 2016 视频 
drwxr-xr-x. root root 6 12H 17 2016 图 片 
drwxr-xr-x. 2 root root 6 12) 17 2016 文档 
drwxr-xr-x. 2 root root 6 12H 17 2016 下 载 
drwxr-xr-x. root root 6 12H 17 2016 音乐 
drwxr-xr-x. root root 6 12H 17 2016 桌面 


把 “总 用 量 12” 看 作 第 1 行 ，1 输出 的 第 2 行 到 第 4 行 的 属性 符号 的 第 一 个 字符 是 “-”， 因 
此 文件 anaconda-ks.cfg、initial-setup-ks.cfg 和 myfile.txt 是 普通 文件 。 

文件 和 普通 文件 的 所 指 范围 不 同 ， 普 通 文 件 一 定 是 文件 ， 但 文件 不 一 定 是 普通 文件 ， 普 通 文 
件 只 是 文件 的 一 个 子 集 。 


4.4.2 目录 


TE Linux 中 ,任何 东西 都 被 看 成 文件 ， 目 录 也 不 例外 。 前 面 提 到 ,目录 保 存 了 该 目录 下 所 有 文 
件 的 文件 名 到 i 节点 号 的 对 应 关系 。 每 个 文件 的 文件 名 和 该 文件 的 i 节点 构成 一 个 目录 项 ， 所 有 的 
目录 项 连 在 一 起 就 是 一 个 目录 〈 块 ) ， 如 图 4-3 所 示 。 





[ses Sk | SE | Bs 


























《自己 找 主 吧 ) 
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我 们 可 以 用 命令 ls -1 或 1 来 查看 某 个 文件 的 属性 符号 (类 似 drw-----), 如 果 第 一 个 字符 是 “d”， 
该 文件 就 表示 一 个 目录 ,这 句 话 是 不 是 感觉 有 点 别扭 ? 要 注意 这 里 说 的 是 “该 文件 ”, 文件 和 普通 
文件 所 指 的 范围 不 同 , 普通 文件 一 定 是 文件 ,但 文件 不 一 定 是 普通 文件 ， 普 通 文 件 只 是 文件 的 一 个 
子 集 。 慢 慢 习 惯 吧 ，Linux 下 一 切 皆 文件 。 比 如 我 们 在 /root 下 运行 ls -1 命令: 





[root@localhost ~]# ls -1 


总 用 量 12 
-rw------- . 1 root root 1659 12H 16 2016 anaconda-ks.cfg 
eiae 1 root root 1707 12) 15 2016 initial-setup-ks.cfg 


root root 01H 27 22:03 myfile.txt 
root root 6 12H 17 2016 per15 

root root 4096 12Ħ 9 06:49 soft 
root root 32 11H 3 22:11 zww 

root root 6 12) 17 2016 公共 


-rwxr-xr-x 

drwxr-xr-x. 
drwxr-xr-x. 
drwxr-xr-x. 
drwxr-xr-x. 


1 
2 
5 
2 
2 
2 
2 
2 
2 
2 
2 
2 


drwxr-xr-x. 2 root root 6 12) 17 2016 模板 
drwxr-xr-x. 2 root root 6 12H 17 2016 视频 
drwxr-xr-x. 2 root root 6 12H 17 2016 图 片 
drwxr-xr-x. 2 root root 6 12Ħ 17 2016 文档 
drwxr-xr-x. root root 6 12H 17 2016 FE 
drwxr-xr-x. 2 root root 6 12) 17 2016 音乐 
drwxr-xr-x. 2 root root 6 12) 17 2016 桌面 


把 “总 用 量 12“ 看 作 第 1 行 , 从 -1 输出 的 第 5 行 到 结束 , 其 属性 符号 的 第 一 个 字符 都 是 “d”， 
因此 从 第 5 行 开始 都 是 目录 。 

当 我 们 新 建 一 个 目录 的 时 候 ， 会 默认 的 分 配 一 个 “ 块 ”， 就 是 你 看 到 的 4096 byte， 目 录 中 文 
件 的 文件 名 和 inode 信息 要 存放 到 这 个 “ 块 ” 中 。 目 录 里 面 文件 增长 ， 要 存储 的 元 信息 也 会 增多 ， 
一 个 “ 块 ”不 够 ,会 再 申请 “ 块 ”， 但 是 最 小 的 单位 就 是 “ 块 ”， 所 以 大 小 总 会 是 4096 的 整数 倍 。 


4.4.3 块 设备 文件 

块 设备 (Block Device) 是 具有 一 定 结构 的 随机 存 取 设 备 ， 对 这 种 设备 的 读 写 是 按 块 进行 的 ， 
它 使 用 缓冲 区 来 存放 暂时 的 数据 , 待 条 件 成 熟 后, 从 缓存 一 次 性 写 入 设备 或 者 从 设备 一 次 性 读 到 缓 
冲 区 。Linux 秉承 “一 切 都 是 文件 ”的 设计 思想 ， 将 所 有 的 块 设备 也 看 成 文件 ， 内 核发 现 一 个 块 设 
备 时 ,会 通知 用 户 空间 ， 用户 空间 的 udevd 后 台 进 程 接收 到 这 些 消息 后 , 会 按照 用 户 指定 的 规则 为 
他 们 创建 块 设备 文件 。 块 设备 文件 通常 存放 在 /dev 下 ， 比 如 /dev/sg1。 常 见 的 块 设备 文件 如 下 : 


/dev/hd[a-t]: IDE 设备 。 

/dev/sd[a-z]: SCSI 设 备 和 SATA 设备 。 
/dev/fd[0-7]: 标准 软驱 。 
/dev/md[0-31]: 软 raid 设备 。 
/dev/loop[0-7]: 本 地 回环 设备 。 
/dev/ram[0-15]: 内 存 。 


其 中 , [里 的 字母 表示 第 几 块 设备 ,数字 代表 分 区 ,因此 /dev/sda3 代表 第 一 块 SATA 接口 的 硬 
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盘 的 第 3 个 分 区 。 我 们 可 以 用 由 和 grep 联合 使 用 来 搜索 出 /dev 下 的 sda 设备 文件 ， 如 下 : 


[root@localhost dev]# 11 /dev|grep sd 


brw-rw---- 1 root disk 8, 0 11H 25 16:16 sda 
brw-rw---- 1 root disk 85 1 11H 25 16:16 sdal 
brw-rw---- 1 root disk IB 2 11H 25 16:16 sda2 
brw-rw---- 1 root disk 8, 3 11H 25 16:16 sda3 


可 以 看 到 ， 块 设备 文件 的 属性 符号 的 第 一 个 字符 是 b，b 就 是 block 的 简写 ， 代 表 块 设备 文件 。 


4.4.4 字符 设备 文件 


相对 于 块 设备 可 以 随机 访问 ， 字 符 设 备 只 能 被 顺序 读 写 。 字 符 设 备 〈Character Device Drive) 
又 称 为 裸 设备 (Raw Devices) 。 常 见 的 字符 设备 有 打印 机 、 计 算 机 显示 器 、 键 盘 、 鼠 标 、 调 试 解 
调 器 、 终 端 等 。 终 端 是 一 种 字符 型 设备 ， 它 有 多 种 类 型 ， 通 常 使 用 tty 来 简称 各 种 类 型 的 终端 设备 。 
tty 是 Teletype 或 者 Teletypewriters 的 缩写 , Teletype 是 最 早出 现 的 一 种 终端 设备 , 很 像 电 传 打字 机 ， 
是 由 Teletype 公司 生产 的 。 字 符 设备 文件 通常 也 是 存放 在 /dev 下 。 

字符 设备 文件 的 属性 符号 的 第 一 个 字符 是 ce, 我 们 用 l 和 grep 联合 搜索 出 /dev 下 的 tty 设备 文 
件 ， 如 下 : 


[root@localhost dev]# 11 /dev|grep tty 


crw-rw-rw- 1 root tty 5x 2 2H T2 13:42 bmx 
crw-rw-rw- 1 root tty Sy 01I 25 16:16 tty 

crw--w---- 1 root tty 4, 0 11 25 16:16 tty0 
Crw--w---- 1 root tty 4, 1 11H 25 08:24 ttyl 
Crw--w---- 1 root tty 4, 10 11H 25 16:16 tty10 
Crw--w---- 1 root tty 4, 11 11H 25 16:16 ttylt 
Crw--w---- 1 root tty 4, 312 13H 25 16:16 ttyl2 


可 以 看 到 属性 符号 的 第 一 个 字符 都 是 ce， 表 示 是 一 个 字符 设备 。 


44.5 ”链接 文件 


链接 相当 于 给 文件 添加 了 另 一 条 索引 。 
要 理解 Linux 下 链接 文件 的 实质 ， 需 要 先 理解 索引 节点 (inode) 和 目录 项 (dentry〉 两 个 基本 
合理 地 使 用 链接 文件 会 对 日 常 使 用 和 系统 管理 带 来 一 些 便利 ， 主 要 包括 以 下 几 方 面 : 


(1) 保持 软件 的 兼容 性 
例如 ， 在 很 多 Linux 发 行 版 中 ，/bin/sh 文件 其 实 是 一 个 指向 /bin/bash 的 符号 链接 。 为 什么 要 这 
样 设计 ? 因为 几乎 所 有 的 shell 脚本 的 第 一 行 都 是 “#!/bin/sh”，“##” 符 号 表示 该 行 指 定 该 脚本 所 
用 的 解释 器 。##/bin/sh 表示 使 用 Bourne Shell 作为 解释 器 ， 这 是 一 个 早期 的 Shell。 在 现代 的 Linux 
发 行 版 中 ， 通 常 采用 Bourne Again Shell ( 即 bash) ，bash 是 对 sh 的 改进 和 增强 ， 而 早期 的 Bourne 
Shell 在 系统 中 根本 不 存在 。 为 了 能 够 顺利 地 运行 脚本 而 不 必修 改 shell 脚本 , 只 需要 创建 一 个 软 链 
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Ti/bin/sh 让 其 指向 /bin/bash。 如 此 一 来 , 就 可 以 让 bash 来 解释 原本 针对 Bourne Shell 编写 的 脚本 了 o 


(2) 方便 软件 的 使 用 

比如 安装 了 一 个 大 型 软件 Matlab， 它 可 能 默认 安装 在 /usr/opt/Matlab 目录 下 ， 可 执行 文件 位 置 
在 /usr/opt/Matlab/bin 目录 下 ， 除 非 你 在 这 个 路 径 加 入 PATH 环境 变量 里 ， 否 则 每 次 运行 这 个 软件 ， 
你 都 需要 输入 一 长 串 的 路 径 ， 很 不 方便 。 此 时 ， 可 以 通过 在 “~/bin” 下 创建 一 个 符号 链接 ， 今 后 
在 命令 行 下 无 须 输入 完整 路 径 ， 只 需 输入 matlab 即 可 。 


(3) 维持 旧 的 操作 习惯 

比如 在 SuSE 中 ， 启 动 脚本 的 位 置 放 在 /etc/init.d 目录 下 ， 而 在 RedHat 的 发 行 版 中 ， 是 放 在 
/etc/init.d/re.d 目录 下 。 为 了 避免 因为 从 SuSE 转换 到 RedHat 系统 而 导致 管理 员 找 不 到 位 置 的 情况 ， 
可 以 创建 一 个 符号 链接 /etc/init.d 使 其 指向 /etc/init.d/re.d。 事 实 上 ，RedHat 发 行 版 也 正 是 这 样 做 的 。 


(4) 方便 系统 管理 

TE/etc/rc.d/rcX.d 目录 下 的 符号 链接 〈X 为 数字 0~7) 是 一 个 非常 典型 的 例子 。 在 init.d/ 目 录 下 
有 许多 用 于 启动 、 停 止 系统 服务 的 脚本 ， 如 sshd、crond 等 。 这 些 脚本 可 以 接收 一 个 参数 ， 代 表 要 
启动 〈start) 或 停止 (stop〉 服务。 为 了 决定 在 某 个 运行 级 别 运行 哪些 脚本 及 传递 给 这 些 脚 本 哪些 
参数 ，RedHat 设计 了 一 个 额外 的 目录 机 制 ， 即 rc0.d~rc6.d 的 7 个 目录 ， 每 个 目录 对 应 一 个 运行 级 
别 。 如 果 在 某 运 行 级 别 下 需要 启动 某 服 务 或 者 停止 某 服务 ， 就 在 对 应 的 reX.d 目录 下 建立 一 个 符号 
链接 ， 指 向 init.d/ 目 录 下 的 脚本 。 

Linux 下 的 链接 文件 可 以 分 为 硬 链接 (文件 ) 和 软 链接 文件) 。 


1. 硬 链接 文件 

硬 链接 的 实质 是 现 有 文件 在 目录 树 中 的 另 一 个 入 口 。 也 就 是 说 ， 硬 链接 相当 于 源 文 件 的 另 一 
个 目录 项 〈directory entry, dentry) 而 已 ， 它 和 源 文件 指向 同一 个 索引 节点 Cindex node, inode) , 
对 应 于 相同 的 磁盘 数据 块 (data block) ， 有 具有 相同 的 访问 权限 、 属 性 等 。 简 而 言 之 ， 硬 链接 其 实 
就 是 给 现 有 的 文件 起 了 一 个 别名 。 如果 把 文件 系统 比喻 成 一 本 书 , 硬 链接 就 是 在 书本 的 目录 中 有 两 
个 目录 项 指向 了 同一 页 码 的 同一 章节 。 硬 链接 的 优点 是 几乎 不 占 磁盘 空间 (因为 仅仅 是 增加 了 一 个 
目录 项 而 已 ) ， 但 是 这 一 优点 相对 于 软 链接 其 实 并 不 明显 〈 因 为 软 链接 占用 的 磁盘 空间 也 很 少 ) 。 
另外 ， 硬 链接 有 以 下 一 些 局 限 : 


CD 不 能 跨 文 件 系统 创建 硬 链接 。 原 因 很 简单 ，inode 号 只 有 在 一 个 文件 系统 内 才能 保证 是 唯 
一 的 ， 如 果 跨 越 文件 系统 ，inode 号 就 可 能 重复 。 

(0 不 能 对 目录 创建 硬 链接 。 正 因为 硬 链接 的 这 些 局 限 ， 加 之 软 链接 更 加 易于 管理 ， 所 以 软 
链接 更 加 常用 。 软 链接 又 称 为 符号 链接 (symbolic link) ， 简 写 为 symlink。 与 硬 链接 仅仅 是 一 个 目 
录 项 不 同 ， 软 连接 实质 上 本 身 也 是 个 文件 ， 不 过 这 个 文件 的 内 容 是 另 一 个 文件 名 的 指针 。 当 Linux 
访问 软 链接 时 ， 它 会 循 着 指针 找 出 含有 实际 数据 的 目标 文件 。 同 样 用 书本 来 打 个 比方 ， 软 链接 是 书 
本 里 的 某 一 章节 ， 不 过 这 一 章节 什么 内 容 都 没有 ， 只 有 一 行 字 “ 转 某 某 章 某 某 页 ”。 软 链接 可 以 跨 
越 文件 系统 指向 另 一 个 分 区 的 文件 , 甚至 可 以 跨越 主机 指向 远程 主机 的 一 个 文件 ,也 可 以 指向 目录 。 
当 创建 了 一 个 软 链接 文件 后 , 它 的 权限 为 777, 即 所 有 权限 都 是 开放 的 , 实际 上 你 也 无 法 使 用 chmod 
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命令 修改 其 权限 , 但 是 实际 文件 的 保护 权限 仍然 起 作用 。 软 链接 还 可 以 指向 不 存在 的 文件 (可 能 是 
原来 指向 的 文件 被 删除 了 , 或 者 指向 的 文件 系统 尚未 挂 载 , 或 者 最 初 建立 该 符号 链接 的 时 候 就 指向 
了 一 个 不 存在 的 文件 ， 等 等 ) ， 此 时 称 这 种 状态 为 “断裂 ” (broken) 。 与 之 相对 的 是 ， 硬 链接 是 
不 能 指向 一 个 不 存在 的 文件 的 。 另 外 , 在 Linux 上 创建 一 个 指向 目录 的 软 链接 是 允许 的 , 但 是 却 不 
能 创建 一 个 指向 目录 的 硬 链接 。 其 实在 UNIX 操作 系统 的 历史 上 ,对 目录 创建 硬 链接 曾经 是 允许 的 。 
但 人 们 发 现 ， 这 样 做 会 出 现 很 多 问题 ， 尤 其 是 一 些 对 目录 树 进行 的 遍历 操作 ， 如 fsck, find 等 命令 
无 法 正确 执行 。 在 《UNIX 环境 高 级 编程 》 中 提 到 作者 在 自己 的 系统 上 做 过 实验 ， 结 果 是 : 创建 目 
录 硬 链接 后 ， 文 件 系统 变 得 错误 百出 。 因 为 这 样 做 会 破坏 文件 系统 的 树 形 结构 ， 可 能 会 使 目录 之 间 
出 现 环 。 


对 于 硬 链接 文件 进行 读 写 时 ， 系 统 会 自动 把 读 写 操作 转换 为 对 源 文件 的 操作 ， 但 删除 硬 链接 
文件 的 时 候 ， 系 统 仅仅 删除 硬 链接 文件 ， 而 不 删除 源 文 件 。 但 如 果 删 除 硬 链接 文件 的 源 文 件 ， 硬 链 
接 文件 依然 存在 ， 而 且 保 留 了 原 有 的 内 容 。 此 时 ， 系 统 会 把 它 当 作 一 个 普通 文件 。 

建立 硬 链接 有 什么 好 处 呢 ? 除了 方便 外 ， 它 还 有 防止 “ 误 删 ”的 作用 。 意 思 是 ， 只 要 文件 的 
索引 节点 号 上 有 一 个 及 以 上 的 硬 链接 ， 该 文件 就 不 会 删除 (文件 的 数据 块 和 目录 链接 不 被 释放 ) 。 


2. 软 链 接 文件 

软 链接 (Soft Link) 也 称 为 符号 链接 (Symbolic Link) .Linux 里 的 软 链接 文件 就 类 似 于 Windows 
系统 中 的 快捷 方式 。Linux 里 的 软 链接 文件 实际 上 是 一 个 特殊 的 文件 ， 可 以 理解 为 一 个 文本 文件 ， 
这 个 文本 文件 中 包含 另 一 个 源 文件 的 位 置信 息 内 容 ， 因此， 通过 访问 这 个 “快捷 方式 ”就 可 以 迅速 
定位 到 软 链接 所 指向 的 源 文件 。 对 软 链 接 文件 进行 读 写 时 ,系统 会 自动 把 读 写 操作 转换 为 对 源 文件 
的 操作 ， 但 删除 软 链接 文件 的 时 候 ， 系 统 仅 删除 链接 文件 ， 而 不 删除 源 文件 。 

对 于 软 链接 文件 ， 文 件 属性 信息 的 第 一 个 字符 是 “1”， 比 如 我 们 可 以 进入 目录 /etc/httpd/， 然 
后 用 1 来 查看 软 链接 文件 ， 如 下 : 

[root@localhost logs]# cd /etc/httpd/ 


[root@localhost httpd]# 11 
总 用 量 8 


drwxr-xr-x. 2 root root 35 12 月 16 2016 conf 

drwxr-xr-x. 2 root root 4096 12)] 16 2016 conf.d 

drwxr-xr-x. 2 root root 4096 12) 16 2016 conf.modules.d 

lrwxrwxrwx. 1 root root 19 12) 16 2016 logs -> ../../var/log/httpd 


lrwxrwxrwx. 1 root root 29 12) 16 2016 modules 
-» ../../usr/lib64/httpd/modules 
lrwxrwxrwx. 1 root root 10 12H 16 2016 run -» /run/httpd 


可 以 看 到 ， 后 3 个 文件 都 是 软 链接 文件 。 


4.5 文件 权限 


文件 或 目录 的 访问 权限 可 分 为 只 读 、 只 写 和 可 执行 3 种 。 以 文件 为 例 ， 只 读 权限 表示 只 人 允许 
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读 其 内 容 , 而 禁止 对 其 做 任何 的 更 改 操 作 。 可 执行 权限 表示 允许 将 该 文件 作为 一 个 程序 执行 。 文 件 
被 创建 时 ， 文 件 所 有 者 自动 拥有 对 该 文件 的 读 、 写 和 可 执行 权限 ， 以 便于 对 文件 进行 阅读 和 修改 。 
用 户 也 可 以 根据 需要 把 访问 权限 设置 为 需要 的 任何 组 合 。 可 以 用 命令 ls -1 来 查看 文件 或 目录 的 权 
限 ， 比 如 : 


[root@localhost ~]# ls -1 


总 用 量 12 

-rwxrwxrwx. 1 root root 629 5 月 18 14:14 myshell.sh 
-rw------- . 1 root root 1659 12H 16 2016 anaconda-ks.cfg 
cH . 1 root root 1707 12H 15 2016 initial-setup-ks.cfg 
drwxr-xr-x. 2 root root 6 12H 17 2016 per15 
drwxr-xr-x. 3 root root 49 6 月 3 07:52 soft 
-rw-rw-rw-. 1 root root 0 10 月 10 16:37 test.txt 
drwxr-xr-x. 2 root root 6 12)] 17 2016 公共 

drwxr-xr-x. 2 root root 6 12) 17 2016 模板 

drwxr-xr-x. 2 root root 6 12) 17 2016 视频 

drwxr-xr-x. 2 root root 6 12)] 17 2016 图 片 

drwxr-xr-x. 2 root root 6 12)] 17 2016 文档 

drwxr-xr-x. 2 root root 6 12H 17 2016 下 载 

drwxr-xr-x. 2 root root 6 12)] 17 2016 音乐 

drwxr-xr-x. 2 root root 32 9)] 14 06:48 桌面 


显示 了 当前 目录 下 所 有 文件 和 目录 的 权限 。 要 查看 某 个 指定 文件 的 权限 ， 可 以 这 样 ; 


[rootélocalhost ~]# ls -1 test.txt 

-rw-rw-rw-. 1 root root 0 10 月 10 16:37 test.txt 

第 一 个 字符 代表 是 文件 还 是 目录 ，- 代 表 非 目录 ，d 代表 目录 。 接 下 来 每 3 个 字符 为 一 组 权限 ， 
分 为 3 组 ， 依 次 代表 所 有 者 权限 、 同 组 用 户 权 限 和 其 他 用 户 权限 。 每 组 权限 的 3 个 字符 依次 代表 是 
否 可 读 、 是 否 可 写 、 是 否 可 执行 ， 其 中 ，r 表示 拥有 读 的 权限 ，w 表示 拥有 写 的 权限 ，x 表示 拥有 
可 执行 的 权限 ，- 表 示 没 有 该 权限 。 


4.6 Linux 文件 I/O 编程 的 基本 方式 


在 Linux 下 对 文件 进行 输入 输出 操作 (1/O 操作 ) 有 3 种 编程 方式 ， 一 种 是 调用 C 库 中 文件 的 
IO 函数 ， 比 如 fopen. fread/fwrite. fclose 等 。 相 信 大 家 在 学 习 C 语言 的 过 程 中 ， 对 这 些 函 数 已 经 
有 所 了 解 ， 这 节 就 不 介绍 了 。 另 外 两 种 方式 是 使 用 Linux 的 系统 调用 和 C++ 文件 流 的 操作 。 


4.7 什么 是 I/O 


VO 就 是 输入 /输出 ， 它 是 主 存 和 外 部 设备 〈 比 如 硬盘 、U 盘 ) 之 间 复 制 数据 的 过 程 ， 其 中 数据 
从 设备 到 内 存 的 过 程 称 为 输入 ,数据 从 内 存 到 设备 的 过 程 叫 输 出 。.VO 可 以 分 为 高 级 1O 和 低级 IO， 
高 级 IO 通常 也 称 为 带 缓冲 的 VO, Ef ANSI C 提供 的 标准 VO E. 低级 VO 通常 也 称 为 不 带 缓 冲 
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的 1O， 它 是 Linux 提供 的 系统 调用 ， 速 度 快 ， 如 函数 open. read. write 等 。 而 带 缓冲 的 IO 在 系 
统 调 用 前 采用 一 定 的 策略 ， 速 度 慢 ， 但 比 不 带 缓冲 的 IO 安全 ， 如 fopen、fread、fwrite 等 。 


4.8 Linux 系统 调用 下 的 文件 I/O 编程 


4.8.1 文件 描述 符 

对 于 Linux 而 言 , 所 有 对 设备 或 文件 的 操作 都 是 通过 文件 描述 符 进行 的 。 当 打开 或 者 创建 一 个 
文件 的 时 候 ， 内 核 向 进程 返回 一 个 文件 描述 符 〈 非 负 整 数 ) 。 后 续 对 文件 的 操作 只 需 通 过 该 文件 描 
述 符 ， 内 核 记 录 有 关 这 个 打开 文件 的 信息 。 一 个 进程 启动 时 ， 默 认 打 开 3 个 文件 ， 标 准 输入 、 标 准 
输出 、 标 准 错误 ， 对 应 文件 描述 符 是 0 CSTDIN FILENO) 、1 ( STDOUT FILENO) 、2 
(CSTDERR_FILENO) ， 这 些 常量 定义 在 unistd.h 头 文件 中 。 

我 们 以 前 可 能 没 接触 过 文件 描述 符 ， 接 触 较 多 的 是 文件 指针 ， 其 实 两 者 之 间 是 可 以 相互 转换 


的 ， 具 体 是 通过 函数 fileno 和 fdopen。 函 数 fileno 将 文件 指针 转换 为 文件 描述 符 ， 声 明 如 下 : 


int fileno(FILE *stream); 


其 中 ， 参 数 stream 是 文件 指针 。 
函数 fdopen 将 文件 描述 符 转换 为 文件 指针 ， 声 明 如 下 : 


FILE *fdopen(int fd, const char *mode); 
其 中 ， 参 数 fd 是 文件 描述 符 ，mode 是 打开 方式 。 


【 例 4.1】 打 印 stdin、stdout 和 stderr 的 文件 描述 符 值 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 


#include <stdlib.h> 
#include <stdio.h> 


int main (void) 

t 
printf("fileno(stdin) = %d\n", fileno(stdin)); 
printf("fileno (stdout) sd\n", fileno(stdout)); 
printf("fileno (stderr) $dWMn", fileno(stderr)); 
return 0; 


) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test testcpp， 然 后 运行 test， 运 行 结 
果 如 下 : 


[root@localhost cpp98]# g++ -o test test.cpp 
[root@localhost cpp98]# ./test 

fileno(stdin) = 0 

fileno (stdout) = 1 
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fileno(stderr) = 2 


4.8.2 ”打开 或 创建 文件 
Linux 提供 open 函数 来 打开 或 者 创建 一 个 文件 。 该 函数 声明 如 下 : 


#include «fcntl.h» 

int open(const char *pathname, int flags); 

int open(const char *pathname, int flags, mode t mode); 

其 中 ， 参 数 pathname 表示 文件 的 名 称 ， 可 以 包含 〈 绝 对 和 相对 ) 路 径 ， flags 表示 文件 打开 方 
3X; mode 用 来 规定 对 该 文件 的 所 有 者 、 文 件 的 用 户 组 及 系统 中 其 他 用 户 的 访问 权限 。 如 果 函 数 执 
行 成 功 ， 就 返回 文件 描述 符 ， 如 果 函 数 执行 失败 ， 就 返回 -1。 

文件 打开 的 方式 flags 可 以 使 用 下 列 宏 ( 当 有 多 个 选项 时 ， 采 用 “|” 连 接 ): 


O RDONLY: 打开 一 个 只 供 读 取 的 文件 。 

O WRONLY: 打开 一 个 只 供 写 入 的 文件 。 

O RDWR: 打开 一 个 可 供 读 写 的 文件 。 

O APPEND: 写 入 的 所 有 数据 将 被 追加 到 文件 的 末尾 。 

O CREAT: 打开 文件 ， 如 果 文 件 不 存在 就 建立 文件 。 

O EXCL: 如 果 已 经 置 OCREAT 上 且 文件 存在 ， 就 强制 open 失败 。 
O TRUNC: 在 打开 文件 时 ， 将 文件 的 内 容 清空 。 

O DSYNC: 每 次 写 入 时 ， 等 待 数据 写 到 磁盘 上 。 

O RSYNC: 每 次 读 取 时 ， 等 待 相同 部 分 先 写 到 磁盘 上 。 

O SYNC: 以 同步 方式 写 入 文件 ， 强 制 刷新 内 核 缓冲 区 到 输出 文件 。 
最 后 3 个 SYNC (同步 ) 选项 都 会 降低 性 能 。 使 用 这 些 宏 需 要 包含 头 文件 fentLh。 值 得 注意 的 
O RDONLY. O WRONLY 或 O_RDWR 这 3 个 选项 是 必 选 其 一 的 。 

mode 只 有 创建 文件 时 才 使 用 此 参数 ， 指 定 文件 的 访问 权限 。 横 式 有 : 


m 


S IRUSR: 文件 所 有 者 的 读 权限 位 。 

S IWUSR: 文件 所 有 者 的 写 权 限 位 。 
S_IXUSR: 文件 所 有 者 的 执行 权限 位 。 

S IRWXU: S IRUSRIS IWUSRIS IXUSR. 
S_IRGRP: 文件 用 户 组 的 读 权限 位 。 
S_IWGRP: 文件 用 户 组 的 写 权 限 位 。 
S_IXGRP: 文件 用 户 组 的 执行 权限 位 。 
S_IRWXG: S IRGRP|S IWGRP|S IXGRP. 
S IROTH: 文件 其 他 用 户 的 读 权限 位 。 

S IWOTH: 文件 其 他 用 户 的 写 权 限 位 。 

S IXOTH: 文件 其 他 用 户 的 执行 权限 位 。 
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€ S IRWXO: S IROTH|S IWOTH|S IXOTH. 

使 用 这 些 权限 宏 , 需要 包含 头 文件 sys/stat.h。 文件 的 访问 权限 是 根据 umask& -mode 得 出 来 的 ， 
例如 umask=0022,mode = 0655， 则 访问 权限 为 : 644。umask 是 目前 用 户 在 建立 档案 或 目录 时 的 权 
限 默 认 值 ， 我 们 可 以 通过 命令 umask 查看 该 值 ， 比 如 : 

[root@localhost ~]# umask 

0022 


[root@localhost ~]# umask -S 
u-rwx,g-rx,o-rx 


加 S 是 以 字符 形式 显示 。 下 面 看 一 个 小 例子 ， 创 建 一 个 指定 权限 的 文件 。 

打开 文件 , 既 可 以 用 相对 文件 又 可 以 用 绝对 路 径 , 比如 打开 当前 目录 zww 下 的 文件 myfile.dat， 
可 以 这 样 写 : 

int fd = open("./zww/myfile.dat", O_RDWR); 

其 中 ，“.” 表 示 当 前 工作 目录 ， 当 前 进程 被 启动 的 目录 就 是 当前 工作 目录 。 

如 果 要 以 只 读 方式 打开 当前 目录 上 级 目录 下 的 某 个 文件 ， 可 以 这 样 写 : 

int fd = open("../myfile.dat", O RDONLY); // 其 中 . .表示 当前 工作 目录 的 上 一 级 目录 


或 者 打开 一 个 绝对 路 径 下 的 文件 ， 比 如 : 


int fd = open("/etc/myfile.dat", O CREAT| O RDWR); // 不 存在 就 新 建 ， 否 则 以 读 写 方 
式 打开 


4.8.3 创建 文件 
为 了 维持 与 早期 的 UNIX 系统 的 向 后 兼容 性 ，Linux 也 提供 了 一 个 专门 创建 文件 的 系统 调用 ， 
即 creat 函数 ， 注 意 结尾 没有 e。 它 的 声明 如 下 : 


int creat (const char *pathname, mode t mode); 


其 中 ， 参 数 pathname 表示 文件 的 名 称 ， 可 以 包含 (绝对 和 相对 〉 路径 ;mode 用 来 规定 对 该 文 
件 的 所 有 者 、 文 件 的 用 户 组 及 系统 中 其 他 用 户 的 访问 权限 ， 其 取 值 与 open 函数 的 mode 相同 。 如 
果 函 数 执行 成 功 ， 就 返回 文件 描述 符 ， 否 则 返回 -1。 

在 UNIX 的 早期 版 本 中 ，open 系统 调用 仅仅 存在 两 个 参数 的 形式 。 如 果 文 件 不 存在 ， 就 不 能 
打开 这 些 文件 。 文 件 的 创建 则 由 单独 的 系统 调用 creat 完成 。 在 Linux 及 所 有 UNIX 的 近代 版 本 中 ， 
creat 系统 调用 是 多 余 的 ， 因 为 open 也 可 以 用 来 创建 文件 。 下 面 两 种 形式 等 价 。 





int fd = creat(file, mode): 
int fd - open(file, O WRONLY | O CREAT | O TRUNC, mode): 


[4 4.2】 创 建 一 个 只 读 的 文件 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 


#include <sys/types.h> 
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#include <sys/stat.h> 
#include «fcntl.h» 
#include <stdio.h> 
#include <unistd.h> 


int main(void) 
t 
int fd - -1; 
char filename[] = "/root/test.txt"; // 注 意 路 径 中 的 /不 要 写成 \ 
fd = creat(filename,0666); // 创 建 只 读 属性 的 文件 
if (fd == -1) 
printf("fail to pen file s\n", filename); 
else 
printf("create file $s successfullyNMn", filename); 


return 0; 


) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test testcpp， 然 后 运行 test， 运 行 结 
果 如 下 : 
[root@localhost cpp98]# g++ -o test test.cpp 


[root@localhost cpp98]# ./test 
create file /root/test.txt successfully 


我 们 在 路 径 /root 下 创建 了 一 个 文件 test.txt。 即 使 test.txt 存在 ， 依 然 会 成 功 。 


4.88.4 关闭 文件 
文件 不 再 使 用 的 时 候 ， 需 要 把 它 关 闭 。 可 以 用 函数 close 来 关闭 文件 ， 该 函数 声明 如 下 : 


#include <unistd.h> 
int close(int fd); 


其 中 ， 参 数 fd 为 要 关闭 的 文件 的 文件 描述 符 。 如 果 函 数 执行 成 功 ， 就 返回 文件 描述 符 ， 和 否则 
返回 -1。 

关闭 以 后 ， 此 文件 描述 符 不 再 指向 任何 文件 ， 从 而 描述 符 可 以 再 次 使 用 。 如 果 每 次 打开 文件 
后 不 关闭 ， 就 会 将 系统 的 文件 描述 符 耗 尽 ， 导 致 不 能 再 打开 文件 。 





【 例 4.3】 打 开 并 关闭 一 个 文件 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 


#include <sys/types.h> 
#include <sys/stat.h> 
#include «fcntl.h» 
#include <stdio.h> 
#include <unistd.h> 
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int main(void) 
t 
int fd - -1; 
char filename[] = "test.txt"; // 若 没有 使 用 绝对 路 径 ， 则 打开 的 是 当前 目录 下 的 
test.txt 
fd = open(filename, O CREAT | O RDWR, S IRWXU); // 打 开 文 件 
if (fd -- -1) 
printf("fail to pen file $s,fd:$dWMn", filename, fd); 
else 
printf("Open file $s successfully, fd:bd\n", filename, fd); 
close(fd); 
return 0; 


} 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test， 运 行 结 
果 如 下 : 


[root@localhost cpp98]# g++ -o test test.cpp 
[root@localhost cpp98]# ./test 
Open file test.txt successfully,fd:3 


如 果 当 前 目录 (就 是 和 可 执行 文件 test 同一 目录 ) 下 没有 test.txt， 就 新 建 一 个 test.txt， 如 果 已 
经 有 了 ， 就 打开 它 。 


【 例 4.4】 循 环 打开 文件 ， 而 不 关闭 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 


#include <sys/types.h> 
#include <sys/stat.h> 
#include «fcntl.h» 
#include <stdio.h> 
#include <unistd.h> 
#include <stdlib.h> 


int main (void) 
t 
int i — 0; 
int fd = 0; 
for (i = 1; fd >= 0; itt) 
t 
fd = open("test.txt", O RDONLY); // 打 开 文 件 
if (fd > 0) 
printf ("fd:bd\n", fd); // 如 果 成 功 ， 就 打印 文件 描述 符 
else 
t 
printf("error,can't openf file Win"); 


exit(1); // 如 果 失 败 ， 就 退出 
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l 
return 0; 


) 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test， 运 行 结 
果 如 下 : 


fd:65530 
fd:65531 
fd:65532 
fd:65533 
fd:65534 
error,can't openf file 


打开 文件 ， 文 件 描述 符 是 65534 的 时 候 ， 就 无 法 再 继续 打开 了 。 如 果 我 们 再 次 运行 test: 


[root@localhost cpp98]# ./test 
error,can't openf file 


可 以 发 现 一 个 文件 都 无 法 打开 了 。 因 为 系统 中 的 文件 描述 符 已 经 耗 尽 了 。 此 时 需要 重启 计算 机 。 


4.8.5 读 取 文 件 中 的 数据 
可 以 用 函数 read 从 已 打开 的 文件 中 读 取 数据 ， 该 函数 声明 如 下 : 


#include <unistd.h> 
Ssize t read(int fd,void * buf ,size t count); 


该 函数 会 把 参数 fd 所 指 的 文件 传送 count 个 字 节 到 buf 指针 所 指 的 内 存 中 。 若 参数 count 为 0， 
W read0 不 会 有 作用 并 返回 0。 返 回 值 为 实际 读 取 到 的 字 节 数 ， 如 果 返 回 0， 表 示 已 到 达 文 件 尾 或 
没有 可 读 取 的 数据 ， 注 意 : 文件 读 写 位 置 会 随 读 取 到 的 字 节 移 动 。 

需要 强调 的 是 ， 如 果 函 数 读 取 成 功 ， 会 返回 实际 读 到 的 数据 的 字 节 数 ， 最 好 能 将 返回 值 与 参 
数 count 做 比较 ， 若 返回 的 字 节 数 比 要 求 读 取 的 字 节 数 少 ， 则 有 可 能 读 到 了 文件 尾 或 者 read0 被 信 
号 中 断 了 读 取 动作 。 当 有 错误 发 生 时 ， 则 返回 -1， 错 误 代 码 存 入 errno 中 ， 此 时 文件 读 写 位 置 无 法 
预期 。 

常见 的 错误 代码 如 下 。 








€ ENTR: 此 调用 被 信号 所 中 断 。 
€  EAGAIN: 当 使 用 不 可 阻 断 IO 时 (O NONBLOCK) ， 若 无 数据 可 读 取 ， 则 返回 此 值 。 
€ EBADF: 参数 fd 为 非 有 效 的 文件 描述 符 ， 或 当前 文件 已 关闭 。 
【 例 4.5】 从 文件 中 读 取 数 据 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 


#include<stdio.h> 
#include<unistd.h> 
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#include<sys/types.h> 
#include<sys/stat.h> 
#include<fcntl.h> 


int main (void) 
t 
int fd = -1l,i; 
ssize t size --1; 
char buf[10]; 
char filename[] = "/root/test.txt"; // 要 读 取 的 文件 


fd = open(filename,O RDONLY); // 只 读 方 式 打开 文件 

if (-1==fd) 

{ 
printf("Open file $s failuer,fd:$dWn",filename, fd); 
return -1; 

) 


else printf("Open file $s success,fd:$dWn", filename, fd); 


// 循 环 读 取 数据 ， 直 到 文件 末尾 或 者 出 错 
while(size) 
{ 
// 读 取 文 件 中 的 数据 ，10 的 意思 是 希望 读 10 个 字 节 ， 但 真正 读 到 的 字 节 数 是 函数 返回 值 
size = read(fd,buf,10); 
if(-1-2-size) 
{ 
close (fd); 
printf ("Read file $s error occurs\n", filename); 
return -1; 
}else{ 
if(size»0) 
t 
printf("read $d bytes:",size); 
Printi (ONY); 
for(i =0;i<size;i++) // 循 环 打印 文件 读 到 的 内 容 
printf("$c",*(bufti)); 
printf("NV"Nn") ; 
}else{ 
printf("reach the end of file \n"); 
} 


) 
) 


return 0; 


) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test， 运 行 结 
果 如 下 : 
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[root@localhost cpp98]# g++ -o test test.cpp 
[root@localhost cpp98]# ./test 

Open file /root/test.txt success,fd:3 

read 3 bytes:"abc" 

reach the end of file 


我 们 可 以 在 /root 下 放 一 个 文本 文件 test.txt， 然 后 输入 3 个 字符 abc， 这 样 程序 就 能 正确 打开 
test.txt 并 读 出 文件 的 内 容 了 。 


4.8.6 向 文件 写 入 数据 
可 以 用 函数 write 将 数据 写 入 已 打开 的 文件 内 ， 该 函数 声明 如 下 : 





#include <unistd.h> 
ssize t write (int fd,const void * buf,size t count); 


该 函数 会 把 参数 buf 所 指 的 缓冲 区 中 的 count 个 字 节 数 据 写 入 fd 所 指 的 文件 内 。 当然, 文件 读 
写 位 置 也 会 随 之 移动 。 其 中 ,参数 亿 是 一 个 已 经 打开 的 文件 描述 符 ; buf 指向 一 个 缓冲 区 ， 表 示 要 
写 的 数据 ;count 表示 要 写 的 数据 的 长 度 ， 单 位 是 字 节 。 如 果 函 数 执行 成 功 ， 就 返回 实际 写 入 数据 
的 字 节 数 。 当 有 错误 发 生 时 ， 则 返回 -1， 错 误 代码 可 以 用 ermo 查看 。 常 见 的 错误 代码 如 下 。 


€  EINTR 此 调用 被 信号 所 中 断 。 

€ EADF 参数 人 包 是 非 有 效 的 文件 描述 符 ， 或 该 文件 已 关闭 。 
【 例 4.6】 向 文件 中 写 入 文件 

(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 


#include<sys/types.h> 
#include<sys/stat.h> 
#include<stdio.h> 
#include<unistd.h> 
#include<fcntl.h> 


int main (void) 

t 
int fd = -1l,i; 
ssize t size --1; 
int input -0; 


char buf[] = "boys and girls\n hi,children!"; // 要 写 入 文件 的 字符 串 
char filename[] = "test.txt"; 


fd = open(filename,O RDWR|O APPEND); // 以 追加 和 读 写 方式 打开 一 个 文件 
if (-1==fd) 
1 
printf("Open file $s faliluer WMn",filename ); 
}else{ 
printf ("Open file $s success \n,=",filename ); 





Linux 文件 编程 第 4 章 





} 
size = write (fd,buf, strlen (buf)); // 向 文件 中 写 入 数据 ， 实 际 写 入 数据 由 函数 返回 存 
入 size 中 


printf("write $d bytes to file $sWMn",size,filename); 














close(fd); 
return 0; 
) 
(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test, 3& 1T 45 
果 如 下 : 
[root@localhost cpp98]# g++ -o test test.cpp 
[root@localhost cpp98]# ./test 
Open file /root/test.txt success 
write 28 bytes to file /root/test.txt 
我 们 可 以 在 /root 下 放 一 个 文件 test.txt， 并 预先 写 入 几 个 字符 ， 比 如 abc， 然 后 运行 该 程序 ， 完 
毕 后 再 打开 文件 ， 可 以 看 到 abe 后 面 追 加 了 我 们 通过 程序 添加 的 内 容 ， 比 如 : 
[root@localhost cpp98]# cat /root/test.txt 


abcboys and girls 
hi,children!boys and girls 


4.8.7” 设 定 文件 偏 移 量 


有 时 候 需 要 从 文件 中 某 个 位 置 开始 读 写 ， 此 时 需要 让 文件 读 写 位 置 移动 到 新 的 位 置 ， 所 以 有 
了 设 定 文件 偏 移 量 的 函数 。 文件 偏 移 量 指 的 是 当前 文件 操作 位 置 相对 于 文件 开始 位 置 的 偏 移 。 当 打 
开 一 个 文件 时 , 如 果 没 有 指定 O_APPEND 参数 , 文件 的 偏 移 量 为 0。 如 果 指 定 了 O_APPEND 参数 ， 
文件 的 偏 移 量 与 文件 的 长 度 相 等 ， 即 文件 的 当前 操作 位 置 移 到 了 末尾 。 

用 来 设 定 文件 偏 移 量 的 系统 函数 是 lseek， 该 函数 声明 如 下 : 

<unistd.h> 

off t lseek( int fd, off t offset, int whence) 

该 函数 对 文件 描述 符 fd 所 代表 的 文件 ， 按 照 操作 模式 whence 和 偏 移 量 的 大 小 off t， 重 新 设 
定 文件 偏 移 量 。 如 果 lseek(0) 函 数 操作 成 功 ， 就 返回 新 的 文件 偏 移 量 的 值 ， 如果 失 败 ， 就 返回 -1。 由 
于 文件 的 偏 移 量 可 以 为 负 值 ， 因 此 判断 lseek(O) 是 否 操作 成 功 时 ， 不 要 使 用 小 于 0 的 判断 ,要 使 用 是 
否 等 于 -1 来 判断 。 参 数 offset 和 whence 搭配 使 用 ， 具 体 含义 如 下 : 





€ ”whence 值 为 SEEK SET f}, offset 为 相对 文件 开始 处 的 值 。 
€ whence 值 为 SEEK_CUR H}, offset 为 相对 当前 位 置 的 值 。 
@@。 whence 值 为 SEEK_END i}, offset 为 相对 文件 结尾 的 值 。 
【 例 4.7】 对 空 文件 设置 偏 移 量 到 5 处 ， 写 入 字符 串 “boys” 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 
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#include <stdio.h> 
#include <sys/types.h> 
#include <sys/stat.h> 
#include <unistd.h> 
#include «fcntl.h» 
#include <string.h> 


int main (void) 

t 
int fd - -1; 
ssize t size = -1; 
off t offset 


Nu 
D 
(5 


char buf[] = "boys"; 
char filename[] = "/root/test.txt"; 


fd = open (filename, O RDWR); // 读 写 方式 打开 文件 

if (-1 == fd) 

{ 
printf ("Open file $s failure, fd:%d", filename, fd); 
return -1; 

} 

offset = lseek (fd, 5, SEEK SET); // 重 新 定义 文件 偏 移 量 到 5 处 

if (-1 -- offset) 

t 
printf("lseek file $s failure,fd:$d", filename, fd); 
return -1; 

) 

size = write(fd, buf, strlen(buf)); // 向 文件 写 入 数据 

if (size !- strlen(buf)) 

t 
printf("write file $s failure,fd:$d", filename, fd); 
return -1; 

} 

close (fd); 

return 0; 


) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test， 运 行 结 
果 如 下 : 


[root@localhost cpp98]# g++ -o test test.cpp 
[root@localhost cpp98]# ./test 
write file boys OK 





我 们 可 以 在 /root 下 存放 一 个 空 文件 (0 字 节 大 小 ) testtxt， 然 后 运行 程序 ， 运 行 完毕 后 把 
/root/test.txt 下 载 到 Windows 下 ， 然 后 双击 打开 它 ， 可 以 看 到 ，boys 的 确 在 距离 文件 开头 5 个 空格 
处 ， 比 如 : 
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boys 


其 实 boys 前 面 的 不 是 空格 ， 而 是 “0”， 因 为 如 果 偏 移 量 的 设置 超出 文件 的 大 小 〈 我 们 原来 的 
文件 大 小 是 0) ， 就 会 造成 文件 空洞 ， 即 文件 尾部 〈0 字 节 的 文件 尾部 其 实 就 是 文件 开头 ) 到 设置 
位 置 之 间 被 “0” 填 充 。 这 种 情况 应 该 避免 ， 我 们 设置 文件 偏 移 量 的 时 候 不 应 该 超出 文件 的 大 小 。 

现在 我 们 在 Windows 下 新 建 一 个 testtxt， 然 后 输入 123456789ABCD， 保 存 并 上 传 到 Linux 的 
/root 下 ， 再 运行 test 程序 后 ， 打 开 文 件 可 以 发 现 ，boys 写 在 5 后 面 了 ， 并 且 6789 被 覆盖 了 ， 比 如 : 


[rootélocalhost cpp98]# cat /root/test.txt 
12345boysABCD 


4.8.8 获取 文件 状态 


在 设计 程序 的 时 候 ， 经 常 要 用 到 文件 的 一 些 特 征 值 ， 如 文件 的 所 有 者 、 文 件 的 修改 时 间 、 文 
件 的 大 小 等 。stat() 函 数 、fstat() 函 数 和 lstat0 函 数 都 可 以 获得 文件 的 状态 。 这 些 函 数 声明 如 下 ， 

int stat(const char *path, struct stat *buf); 

int fstat(int filedes, struct stat *buf); 

int lstat(const char *path, struct stat *buf); 

其 中 ， 参 数 path 是 文件 的 路 径 〈 含 文件 名 ) ; filedes 是 文件 描述 符 ，buf 为 指向 struct stat 结 
构 体 的 指针 ， 获 得 的 状态 从 这 个 参数 中 传 回 。 当 函数 执行 成 功 时 返回 0， 执 行 失败 时 返回 -1。 

fstat 区 别 于 另外 两 个 系统 调用 的 地 方 在 于 ，fstat 系统 调用 接收 的 是 一 个 “文件 描述 符 ”， 而 
另外 两 个 则 直接 接收 “文件 全 路 径 ”。 文 件 描述 符 是 需要 我 们 用 open 系统 调用 后 才能 得 到 的 ， 而 
文件 全 路 径直 接 写 就 可 以 了 。stat 和 Istat 的 区 别 : 当 文件 是 一 个 符号 链接 时 ，lstat 返回 的 是 该 符号 
链接 本 身 的 信息 ; 而 stat 返回 的 是 该 链接 指向 的 文件 的 信息 。 结 构 体 struct stat. 为 一 个 描述 文件 状 
态 的 结构 ， 定 义 如 下 : 


struct stat { 





mode t st mode; // 文 件 对 应 的 模式 、 文 件 、 目 录 等 
ino t st ino; /Vinode 节 点 号 

dev 七 st dev; / [Vo 

dev t st rdev; // 特 殊 设备 号 码 

nlink 七 st nlink; // 文 件 的 链接 数 

uid 七 st uid; // 文 件 所 有 者 

gid 七 st gid; // 文 件 所 有 者 对 应 的 组 

off 七 st size; // 普 通 文件 ， 对 应 的 文件 字 节 数 


time 七 st atime; // 文 件 最 后 被 访问 的 时 间 
time t st mtime; // 文 件 内 容 最 后 被 修改 的 时 间 
time t st ctime; // 文 件 状态 改变 的 时 间 
blksize t st blksize; // 文 件 内 容 对 应 的 块 大 小 
blkcnt t st blocks; // 文 件 内 容 对 应 的 块 数量 

}; 


[51 4.8】 获 取 文 件 的 状态 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 
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#include<sys/stat.h> 
#include<sys/types.h> 
#include<unistd.h> 
#include <iostream> 
using namespace std; 


int main (void) 
t 


struct stat st; 


if (-1 == stat("/root/test.txt", &st)) // 获 取 文 件 状态 
t 
cout << ("stat failed\n"); 
return -1; 
) 
cout««"file length:"««st.st size««"byte"««endl; // 文 件 长 度 
cout «« "mod time:" << st.st mtime «« endl; // 最 后 修改 时 间 
cout «« "node:" «« st.st ino «« endl; // 节 点 
cout «« "mode:" «« st.st mode «« endl; // 模 式 
) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test， 运 行 结 
RP: 

[root@localhost cpp98]# g++ -o test test.cpp 

[rootQlocalhost cpp98]4 ./test 

file length:l13byte 

mod time:1508633499 


node:82506175 
mode:33188 


4.8.9 文件 锁定 


当 多 个 用 户 共同 使 用 、 操 作 一 个 文件 时 ，Linux 采用 的 方法 就 是 给 文件 上 锁 ， 来 避免 共享 的 资 
源 产生 竞争 的 状态 。 文 件 锁 分 为 建议 性 锁 和 强制 性 锁 。 建 议 性 锁 是 指 给 文件 上 锁 后 ， 只 在 文件 上 设 
置 一 个 锁 的 标识 ， 其 他 进程 在 对 这 个 文件 进程 操作 时 ， 可 以 检测 到 锁 的 存在 ， 但 这 个 锁 并 不 能 阻止 
它 〈 其 他 进程 ) 对 这 个 文件 进行 操作 ， 这 就 好 比 红绿灯 ， 当 红 灯 亮 时 ， 告 诉 你 不 要 过 马路 ， 但 如 果 
你 一 定 要 过 ， 也 拦 不 住 你 。 强 制 性 锁 则 是 当 给 文件 上 锁 后 ， 当 其 他 进程 要 对 这 个 文件 进行 不 兼容 的 
操作 (比如 上 了 读 锁 ， 另 一 个 进程 要 写 ) 时 ， 系 统 内 核 将 阻塞 后 来 的 进程 ， 直 到 第 一 个 进程 将 锁 解 
开 。 一 般 情 况 下 ， 内 核 和 系统 都 不 适合 用 建议 性 锁 ， 而 要 使 用 强制 性 锁 ， 这 样 可 以 防止 一 些 破坏 性 
操作 。 每 个 进程 对 文件 操作 时 ， 例 如 执行 open, read, write 等 操作 时 ， 内 核 都 会 检测 该 文件 是 否 
被 加 了 强制 性 锁 ， 如 果 加 了 强制 性 锁 ， 就 会 导致 这 些 文件 操作 失败 ， 也 就 是 内 核 强制 应 用 程序 来 遵 
守 游 戏 规则 ， 这 就 是 强制 性 锁 的 原理 所 在 。 

值得 注意 的 是 , 对 文件 加 锁 是 原子 性 的 。 另外 ,由 fork 产生 的 子 进程 不 继承 父 进程 所 设置 的 锁 。 
意味 着 ， 若 一 个 进程 得 到 一 把 锁 ， 然 后 调用 fork， 那 么 对 于 父 进程 获得 的 锁 而 言 ， 子 进程 被 视 为 另 
一 个 进程 。 对 于 从 父 进程 处 继承 过 来 的 任 一 描述 符 ， 子 进程 需要 调用 fentl 才能 获得 它 自 己 的 锁 。 
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Linux 下 可 以 用 fentl 函数 来 实现 文件 的 锁定 。 文 件 锁定 在 很 多 场合 都 很 有 用 ， 比 如 为 了 防止 


进程 重复 启动 , 可 以 在 进程 启动 时 对 /var/run 下 的 .PID 文件 进行 锁定 , 这 样 后 面 的 进程 重复 启动 时 ， 


A 











因为 无 法 对 该 文件 上 锁 而 退出 。fcntl 函数 不 仅 能 对 整个 文件 上 锁 ， 而 且 可 以 对 文件 的 某 一 记录 





上 锁 ， 此 时 的 锁 又 可 称 为 记录 锁 。 


函数 fcntl 声明 如 下 : 


#include <unistd.h> 
#include «fcntl.h» 
int fentl(int fd, int cmd, struct flock *lock); 


其 中 ， 参 数 fd 是 文件 描述 符 ，cmd 是 操作 命令 。 对 于 文件 锁定 ， 取 值 如 下 : 

€ F GETLK: 根据 lock 描述 ， 决 定 是 否 上 文件 锁 (或 记录 锁 ) 。 

€ F SETLK: 设置 lock 描述 的 文件 锁 (或 记录 锁 ) 。 

lock 是 指向 结构 体 flock 的 指针 ， 表 示 一 个 文件 锁 或 记录 锁 ， 用 于 将 整个 文件 或 者 文件 中 的 某 


一 记录 〈 即 某 一 部 分 字 节 ) 锁 起 来 。 锁 的 类 型 有 两 种 : 建议 锁 和 强制 锁 。 建 议 锁 ， 顾 名 思 义 ， 相 对 
温柔 一 些 , 在 对 文件 进行 锁 操 作 时 ， 会 检测 是 否 已 经 有 锁 存 在 ， 并 且 尊重 已 有 的 锁 ， 但 是 另外 的 进 
程 还 是 可 以 自由 修改 文件 的 ， 如 果 你 编写 的 程序 或 者 程序 新 创建 的 进程 都 以 一 致 的 方式 处 理 文 件 


理 


或 记录 ) 锁 〈 即 在 读 写 前 都 申请 一 次 文件 (或 记录 ) 锁 ， 或 者 都 不 申请 ， 总 之 要 以 一 致 的 方式 处 
) ， 就 不 会 发 生 冲 突 ， 这 样 的 进程 集 称 为 合作 进程 ， 合 作 进程 使 用 建议 性 锁 是 可 行 的 。 但 是 如 果 


需要 阻止 非 你 创建 的 进程 也 按照 一 致 的 方式 处 理 记录 锁 ,就 只 能 使 用 强制 性 记录 锁 了 。 强 制 锁 是 由 
内 核 执行 的 锁 ， 当 一 个 文件 被 上 锁 进 行 写 入 操作 的 时 候 ， 内 核 将 阻止 其 他 进程 对 其 进行 读 写 操作 。 
采取 强制 锁 对 性 能 的 影响 很 大 ，fuctl 默认 是 建议 锁 ， 如 果 想 在 Linux 中 使 用 强制 锁 ， 则 要 在 root 
权限 下 ， 通 过 mount 命令 用 -o mand 选项 打开 该 机 制 。 结 构 体 flock 定义 如 下 : 


struct flock 

{ 
short int 1 type;// 锁 定 的 状态 
short int 1 whence;// 决 定 1_start 的 位 置 
off t 1_start;// 锁 定 区 域 的 开头 位 置 
off t 1_len;// 锁 定 区域 的 大 小 
pid t 1_piqd;// 锁 定 动作 的 进程 

] 


I type 有 以 下 3 个 选项 。 

€ F RDLCK: 共享 锁 (也 称 读 取 锁 ) ， 只 读 用 ， 多 个 进程 可 以 同时 建立 读 取 锁 。 
€ F WRLCK: 独占 锁 (也 称 写 入 锁 ) ， 在 任何 时 刻 只 能 有 一 个 进程 建立 写 入 锁 。 
€ FUNLCK: 解除 锁定 。 

1 whence 必须 是 以 下 几 个 值 之 一 〈 在 unistd.h 中 定义 ) 。 


€ SEEK SET: 文件 开始 位 置 。 
@ SEEK CUR: 文件 当前 位 置 。 
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€ SEEK END: 文件 末尾 位 置 。 
l start 为 相对 开始 偏 移 量 ， 相 对 于 1 whence 而 言 。 


€ len: 加 锁 的 长 度 ，0 为 到 文件 末尾 。 
€ 1 pid: 当前 操作 文件 的 进程 ID 号 。 


如 果 函 数 成 功 ， 就 返回 0， 和 否则 返回 -1， 此 时 可 以 用 errno 查看 错误 码 。 
是 不 是 感觉 这 个 fentl 函数 有 点 复杂 ? 其 实 上 面 只 是 针对 锁 文 件 的 情况 ，fentl 函数 还 有 其 他 功 
能 和 形式 ， 这 里 暂且 不 介绍 。 下 面 我 们 来 看 一 个 关于 fentl 函数 的 小 例子 。 


【 例 4.9】 测 试 建议 锁 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 


#include «fcntl.h» 
#include <stdio.h> 
#include <error.h> 
#include <sys/stat.h> 
#include <unistd.h> 


int main(int argc, char* argv[]) 
t 
struct flock lock; // 定 义 文件 锁 
int res, fd = open("myfile.txt", O RDWR|O CRERAT,0777) ; // 创 建 一 个 文本 文件 
if (fd » O0) 
t 
lock.l type = F WRLCK; // 独 占 锁 
lock.l whence = SEEK SET; // 文 件 开始 位 置 
lock.l start = 0; // 根 据 1_whence 而 定 的 相对 开始 偏 移 量 
lock.l len = 0; // 锁 到 文件 末尾 
lock.l pid = getpid(); 
res = fcntl(fd, F SETLK, &lock); // 设 置 文件 锁 
printf("return value of fcntl-$dWn", res); 
while (true) 


) 


return 0; 


) 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test testcpp， 然 后 运行 test， 运 行 结 
果 如 下 : 
[root@localhost test]# g++ -o test test.cpp 


[rootélocalhost test]# ./test 
return value of fcntl-0 


现在 程序 处 于 死 循 环 中 ， 一 直 在 运行 了 。 此 时 这 个 终端 被 test 程序 独占 ， 我 们 需要 新 开 一 个 
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shell (可 以 在 secureCRT 下 直接 克隆 会 话 ) 来 修改 myfile.txt 文件 。 


[rootélocalhost ~]# cd /zww/test 

[root@localhost test]# cat myfile.txt 
[root@localhost test]f echo "hello" >> myfile.txt 
[root@localhost test]# cat myfile.txt 

hello 


可 以 看 到 ， 开 始 myfile.xt 内 容 是 空 的 ， 我 们 用 echo 写 入 一 个 字符 串 hello 后 ， 内 容 就 有 了 ， 


说 明 修改 成 功 了 。 更 说 明 ， 在 建议 锁 锁 住 的 情况 下 ， 其 他 进程 的 确 是 可 以 修改 被 锁 文件 的 。 因 此 ， 





建议 锁 只 适用 于 合作 进程 。 


通过 一 个 比喻 再 次 强调 ， 建 议 性 锁 就 是 假定 人 们 都 会 遵守 某 些 规则 去 干 一 件 事 。 例 如 ， 人 与 


车 看 到 红 灯 都 会 停 ， 而 看 到 绿灯 才 会 继续 走 ， 我 们 可 以 称 红绿灯 为 建议 锁 。 但 这 是 一 种 需要 大 家 主 
动 去 遵守 的 规则 ， 你 并 不 能 阻止 某 些 人 强 疤 红 灯 。 而 强制 性 锁 是 你 想 疤 红 灯 也 冯 不 了 。 


下 面 我 们 来 具体 看 看 强制 锁 ， 实 现 强 制 性 锁 需 将 文件 所 在 的 文件 系统 通过 mount 命令 的 “-o 


mand” 选 项 来 挂 载 ， 并 且 使 用 chmod 函数 或 chmod 命令 将 文件 用 户 组 的 x 权限 去 掉 〈 即 清除 组 可 
执行 位 ) 。 
【 例 4.10】 测 试 强制 锁 


首先 查看 我 们 的 硬盘 信息 ， 在 shell 下 输入 命令 : 


[rootG(localhost dev]# df -hT 


文件 系统 类 型 容量 已 用 可 用 已 用 % ERA 

devtmpfs devtmpfs 465M 0 465M 0$ /dev 

tmpfs tmpfs 493M 144K 492M 1$ /dev/shm 
tmpfs tmpfs 493M 14M 479M 3$ /run 

tmpfs tmpfs 493M 0 493M 0$ /sys/fs/cgroup 
/dev/mapper/centos-root xfs 78G 21G 57G 27% / 
/dev/sdal xfs 497M 265M 232M 54$ /boot 

tmpfs tmpfs 99M 20K 99M 1$ /run/user/0 


Hop, -T 选项 表示 查看 文件 系统 类 型 。/zww/test 下 的 myfile.txt Je TE/dev/mapper/centos-root 


上 的 ， 所 以 进入 /zww/test 后 ， 重 新 挂 载 : 


[root@localhost dev]# cd /zww/test 
[root@localhost test]# mount -o remount,mand /dev/mapper/centos-root 


此 时 文件 系统 /dev/mapper/centos-root 增加 了 mand 选项 ， 我 们 再 来 修改 myfile.txt 的 权限 : 
[root@localhost test]# chmod g*s,g-x myfile.txt 
ga 表示 将 用 户 组 的 x 权限 去 掉 。 然 后 再 次 运行 上 例 的 test 程序 : 


[rootélocalhost test]# ./test 
return value of fcntl-0 


此 时 程序 处 于 死 循环 运行 中 , 我 们 再 新 开 一 个 终端 shell, 然后 尝试 向 myfile.txt 写 入 新 的 内 容 : 
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[root@localhost test]# echo "boy" >> myfile.txt 


可 以 发 现 , # 提 示 符 不 出 现 了 ,说 明 echo 命令 被 阻塞 不 动 了 (内 核 阻止 了 它 )， 说 明 我 们 的 强 
制 锁 生 效 了 。 下面 用 Ctri-C 快捷 键 结束 test 程序 , 可 以 发 现 另 一 个 shell 下 的 echo 命令 的 阻塞 被 解 
除了 ， 出 现 # 提 示 符 : 


[root@localhost test]# 
我 们 再 来 查看 myfile.txt 的 内 容 : 


[root@localhost test]# cat myfile.txt 

hello 

boy 

可 以 发 现 ，boy 写 入 成 功 。 这 说 明 强 制 锁 解除 后 ， 就 可 以 写 入 新 内 容 了 ， 否 则 就 无 法 写 入 。 从 
这 个 例子 可 以 发 现 , 我 们 并 没有 重新 修改 代码 , 程序 依旧 是 上 例 的 程序 ， 只 是 进行 了 一 些 系 统 设置 
(重新 加 载 了 文件 系统 ， 修 改 了 文件 的 权限 ) o fol 真是 一 个 奇特 的 函数 ， 实 现 一 个 功能 并 不 是 
通过 本 身 的 参数 控制 ， 而 是 通过 系统 设置 。 


4.8.10 ”建立 文件 和 内 存 映射 

所 谓 文件 和 内 存 映射 ， 就 是 将 普通 文件 映射 到 内 存 中 ， 普 通 文件 被 映射 到 进程 地 址 空间 后 ， 
进程 可 以 像 访 问 普通 内 存 一 样 对 文件 进行 访问 ， 不 必 再 调用 read 或 write 等 操作 。 系 统 提供 了 函数 
mmap 将 普通 文件 映射 到 内 存 中 ， 该 函数 声明 如 下 : 

void *mmap (void *start, size t length, int prot, int flags, int fd, off t 
offset); 

其 中 ,参数 start 为 映射 区 的 起 始 地 址 ， 通 常 为 NULL (或 0) ， 表 示 由 系统 自己 决定 映射 到 什 
么 地 址 ; length 表示 映射 数据 的 长 度 ， 即 文件 需要 映射 到 内 存 中 的 数据 的 大 小 ; prot 表示 映射 区 保 
护 方式 ， 取 下 列 某 个 值 或 者 它们 的 组 合 。 


€ PROT EXEC: 映射 区 可 被 执行 。 
€ PROT READ: 映射 区 可 读 取 。 
€ PROT WRITE: 映射 区 可 写 入 。 
€ PROT NONE: 映射 区 不 可 访问 。 
flags 用 来 指定 映射 对 象 的 类 型 、 映 射 选项 和 映射 页 是 否 可 以 共享 。 它 的 值 可 以 是 一 个 或 者 多 
个 位 的 组 合 。 
€ MAP FIXED: 如 果 参 数 start 指定 了 需要 映射 到 的 地 址 ， 而 所 指定 的 地 址 无 法 成 功 建 
立 映 射 ， 映射 就 会 失败 。 通 常 不 推荐 使 用 此 设置 ， 而 将 start 设 置 为 NULL (或 0)， 
由 系统 自动 选取 映射 地 址 。 
© MAP SHARED: 共享 映射 区 域 ， 映 射 区 域 允 许 其 他 进程 共享 ， 对 映射 区 域 写 入 数据 


S276! 
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将 会 写 入 原来 的 文件 中 。 

MAP RIVATE: 对 映射 区 域 进行 写 入 操作 时 会 产生 一 个 映射 文件 的 复制 ， 即 写 入 复 
4| (copy on write ) ， 而 读 操作 不 会 影响 此 复制 。 对 此 映射 区 的 修改 不 会 写 回 原来 的 
文件 ， 即 不 会 影响 原来 文件 的 内 容 。 

MAP ANONYMOUS: 建立 匿名 映射 。 映 射 区 不 与 任何 文件 关联 ， 而 且 映 射 区 无 法 
与 其 他 进程 共享 。 

MA DENYWRITE: 对 文件 的 写 入 操作 将 被 禁止 ， 不 允许 直接 对 文件 进行 操作 。 
MAP LOCKED: 将 映射 区 锁定 ， 防 止 页 面 被 交换 出 内 存 。 


参数 flags 必须 为 MAP SHARED 或 者 MAP PRIVATE 二 者 之 一 的 类 型 。 MAP_SHARED 类 型 
表示 多 个 进程 使 用 的 是 一 个 内 存 映 射 的 副本 , 任何 一 个 进程 都 可 对 此 映射 进行 修改 , 其 他 的 进程 对 
其 修改 是 可 见 的。 而 MAP PRIVATE 则 是 多 个 进程 使 用 的 文件 内 存 映 射 ， 在 写 入 操作 后 ， 会 复制 
一 个 副本 给 修改 的 进程 , 多 个 进程 之 间 的 副本 是 不 一 致 的 。 参数 fd 表示 文件 描述 符 , 一 般 由 open) 
函数 返回 ， 参数 offset 表示 被 映射 数据 在 文件 中 的 起 点 。 

mmap0 映 射 后 ， 让 用 户 程 序 直 接 访 问 设备 内 存 ， 相 比较 在 用 户 空间 和 内 核 空间 互相 复制 数据 ， 
效率 更 高 ， 在 要 求 高 性 能 的 应 用 中 比较 常用 。mmap 映射 内 存 必须 是 页 面 大 小 的 整数 倍 ， 面 向 流 的 
设备 不 能 进行 mmap，mmap 的 实现 和 硬件 有 关 。 

下 面 这 个 例子 显示 了 把 文件 映射 到 内 存 的 方法 。 


【 例 4.11】 文 件 与 内 存 映射 
(1) 打开 UE， 输 入 代码 如 下 : 


#include «sys/mman.h» /* for mmap and munmap */ 
#include <sys/types.h> /* for open */ 

#include «sys/stat.h» /* for open */ 

#include «fcntl.h» /* for open */ 

#include «unistd.h» /* for lseek and write */ 
#include <stdio.h> 


int main(int argc, char **argv) 


t 


int fd; 

char *mapped mem, * p; 
int flength - 1024; 
void * start addr - 0; 


fd = open(argv[1], O RDWR | O CREAT, S IRUSR | S IWUSR) ; 

flength - lseek(fd, 1, SEEK END); 

write(fd, "VO", 1); /* 在 文件 最 后 添加 一 个 空 字符 ， 以 便 下 面 的 printf 正 常 工作 */ 
lseek(fd, 0, SEEK SET); 

mapped mem -(char*) mmap(start addr, 


flength, 
PROT READ, // 人 允许 读 
MAP PRIVATE, // 不 允许 其 他 进程 访问 此 内 存 区 域 
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fd, 
0); 


/* 使 用 映射 区 域 */ 
printf("%s\n"，mapped mem); /* 为 了 保证 这 里 工作 正常 ， 参 数 传递 的 文件 名 最 好 是 一 个 


交 本 文件 区 / 


close(fd); 
munmap (mapped mem, flength); 
return 0; 


) 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test myfile.txt 


hello 
boy 


可 以 发 现 , 程序 把 文件 中 的 内 容 映 射 到 内 存 后 ,再 把 该 内 存 区 域 打印 出 来 ,显示 的 正 是 文件 中 


的 内 容 。 其 中 ， 


myfile.txt 是 自己 新 建 的 文本 文件 。 


上 面 的 方法 因为 用 了 PROT_READ， 所 以 只 能 读 取 文件 里 的 内 容 ， 不 能 修改 ， 如 果 换 成 
PROT_WRITE， 就 可 以 修改 文件 的 内 容 了 。 又 由 于 用 了 MAAP_PRIVATE， 因 此 此 进程 只 能 使 用 
此 内 存 区 域 ， 若 换 成 MAP_SHARED， 则 可 以 被 其 他 进程 访问 ， 请 看 下 例 。 

【 例 4.12】 修 改 文件 的 内 存 映 像 

(1) 打开 UE， 输 入 代码 如 下 : 


#include 
#include 
#include 
#include 
#include 
#include 
#include 


<sys/mman.h> /* for mmap and munmap */ 
<sys/types.h> /* for open */ 
«sys/stat.h» /* for open */ 


«fcntl.h» /* for open */ 
<unistd.h> /* for lseek and write */ 
<stdio.h> 


<string.h> /* for memcpy */ 


int main(int argc, char **argv) 


i 


int fd; 


char 


*mapped mem, * p; 


int flength - 1024; 
void * start addr - 0; 


fd - open(argv[1], O RDWR | O CREAT, S IRUSR | S IWUSR); 

flength - lseek(fd, 1, SEEK END); 

write(fd, "VO", 1); // 在 文件 最 后 添加 一 个 空 字符 ， 以 便 下 面 的 printf 正 常 工 作 
lseek(fd, 0, SEEK SET); 

start addr - (void*)0x80000; 


mapped mem 


(char*)mmap (start addr, 
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flength, 

PROT READ|PROT WRITE, // 允 许 写 入 

MAP SHARED, // 人 允许 其 他 进程 访问 此 内 存 区 域 
fd; 

0); 


// 使 用 映射 区 域 
printf("%s\n", mapped mem); // 为 了 保证 这 里 正常 工作 ， 参 数 传递 的 文件 名 最 好 是 一 个 文 
本 文件 
while ((p = strstr(mapped mem, "hello"))) { // 此 处 来 修改 文件 内 容 ，hello 必 
须 在 文件 中 已 经 有 
memcpy(p, "Linux", 5); // 我 们 把 hel1lo 改 为 Linux 
p t= 5; 
} 


close (fd); 
munmap (mapped mem, flength); 
return 0; 


} 
(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test myfile.txt 
hello 

boy 


再 次 查看 myfile.txt， 可 以 发 现 内 容 变 了 : 


[root@localhost test]# cat myfile.txt 
Linux 
boy 


说 明 我 们 修改 内 存 映 像 成 功 。 


4.8.11 mmap 和 共享 内 存 对 比 
共享 内 存 允许 两 个 或 多 个 进程 共享 一 个 给 定 的 存储 区 ， 因 为 数据 不 需要 来 回复 制 ， 所 以 是 最 
快 的 一 种 进程 间 通 信 机 制 。 共 享 内 存 可 以 通过 mmap0 映 射 普 通 文件 〈 特 殊 情 况 下 还 可 以 采用 匿名 
映射 ) 机 制 实现 ， 也 可 以 通过 系统 V 共享 内 存 机 制 实现 。 应 用 接口 和 原理 很 简单 ， 内 部 机 制 复杂 。 
为 了 实现 更 安全 的 通信 ， 往 往 还 与 信号 灯 等 同步 机 制 共 同 使 用 ， 对 比如 下 。 

mmap 机 制 : 就 是 在 磁盘 上 建立 一 个 文件 , 每 个 进程 存储 器 里 面 单独 开辟 一 个 空间 来 进行 映射 。 
如 果 是 多 进程 ， 那 么 对 实际 的 物理 存储 器 ( 主 存 ) 消耗 不 会 太 大 。mmap 保存 到 实际 硬盘 ， 实 际 存 
储 并 没有 反映 到 主 存 上 。 优 点 是 储存 量 可 以 很 大 (多 于 主 存 ) ， 缺 点 是 进程 间 读 取 和 写 入 速度 要 比 
主 存 的 要 慢 。 

shm 机 制 :每 个 进程 的 共享 内 存 都 直接 映射 到 实际 物理 存储 器 里 面 .shm 保存 到 物理 存储 器 ( 主 
存 ) ， 实 际 的 储存 量 直 接 反 映 到 主 存 上 。 优 点 是 进程 间 访问 速度 ( 读 写 ) 比 磁盘 要 快 ， 缺 点 是 存储 











Linux C 与 C++ 一 线 开发 实践 





量 不 能 非常 大 〈 多 于 主 存 ) 。 
从 使 用 上 看 ， 如 果 分 配 的 存储 量 不 大 ， 就 使 用 shm; 如 果 存 储量 大 ， 就 使 用 mmap。 


49 C++ 方式 下 的 文件 I/O 编程 


4.9.1 流 的 概念 


在 C++ 语言 中 ， 数 据 的 输入 和 输出 〈 简 写 为 TO) 包括 对 标准 输入 设备 〈 键 盘 ) 和 标准 输出 设 
备 (显示 器 ) 、 在 外 存 磁 盘 上 的 文件 和 内 存 中 指定 的 字符 串 存储 空间 (当然 可 用 该 空间 存储 任何 信 
息 ) 进行 输入 输出 3 方面 。 对 标准 输入 设备 和 标准 输出 设备 的 输入 输出 简称 为 标准 1JO， 对 在 外 存 
磁盘 上 文件 的 输入 输出 简称 为 文件 TO， 对 内 存 中 指定 的 字符 串 存 储 空间 的 输入 输出 简称 为 串 IO。 

“ 流 ” 就 是 “流动 ”是 物质 从 一 处 向 另 一 处 流动 的 过 程 。 C++ 流 是 指 信息 从 外 部 输入 设备 (如 
键盘 和 磁盘 ) 向 计算 机 内 部 ( 即 内 存 ) 输入 和 从 内 存 向 外 部 输出 设备 (如 显示 器 和 磁盘 ) 输出 的 过 
程 ， 这 种 输入 输出 过 程 被 形象 地 比喻 为 “ 流 ”。 为 了 实现 信息 的 内 外 流动 ，C++ 系 统 定义 了 IO 类 
库 ， 其 中 的 每 一 个 类 都 称 作 相应 的 流 或 流 类 ,用 以 完成 某 一 方面 的 功能 。 一 个 流 类 定义 的 对 象 也 时 
常 被 称 为 流 。 例 如 根据 文件 流 类 fstream 定义 的 一 个 对 象 fio 可 称 作为 fio 流 或 fio 文件 流 ， 用 它 可 
以 同 磁盘 上 一 个 文件 相 联系 ， 实 现 对 该 文件 的 输入 和 输出 ，fio 就 等 同 于 与 之 相 联 系 的 文件 。 

因为 C++ 兼容 C， 所 以 C 中 的 输入 输出 函数 依然 可 以 在 C++ 中 使 用 ， 但 是 很 显然 ， 直 接 把 C 
的 那 套 输入 输出 搬 到 C++ 中 肯定 无 法 满足 C++ 的 需求 ,重要 的 一 点 是 ,C 中 的 输入 输出 有 类 型 要 求 ， 
只 支持 基本 类 型 ， 很 显然 没 办 法 满足 C++ 的 需求 ， 因 此 C++ 设计 了 易于 使 用 的 并 且 多 种 输入 输出 
流 接口 统一 的 IO 类 库 ， 并 且 支 持 多 种 格式 化 操作 ， 还 可 以 自 定义 格式 化 操作 。 总 体 来 说 ，C++ 中 
有 3 种 输入 输出 流 。 


CD 标准 IO 流 : 内 存 与 标准 输入 输出 设备 之 间 信息 的 传递 。 

(2) 文件 IO 流 : 内存 与 外 部 文件 之 间 信 息 的 传递 。 

OD 字符 串 IO 流 : 内 存 变 量 与 表示 字符 串 流 的 字符 数组 之 间 信 息 的 传递 。 

C++ 引入 IO 流 ， 将 这 3 种 输入 输出 流 接 口 统一 起 来 ， 使 用 符号 “>>” 读 取 数 据 的 时 候 ， 不 用 
去 管 是 从 何 处 读 取 数 据 ， 使 用 符号 “<<” 写 数据 的 时 候 ， 也 不 需要 管 是 写 到 哪里 去 。 


4.9.2 流 的 类 库 


C++ 语言 系统 为 实现 数据 的 输入 和 输出 定义 了 一 个 庞大 的 类 库 ， 其 中 ios 为 根基 类 ， 其 余 都 是 
它 的 直接 或 间接 派生 类 ， 它 直接 派生 4 个 类 : 输入 流 类 istream、 输 出 流 类 ostream、 文 件 流 基 类 
fstreambase 和 字符 串 流 基 类 strstreambase.C++ 系 统 中 的 VO 类 库 的 所 有 类 被 包含 在 iostream 、fstream 
和 strstream 3 个 系统 头 文件 中 。 我 们 可 以 用 图 4-4 来 表示 各 个 类 的 继承 关系 。 


* 280* 
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图 4-4 


头 文件 <fstream> 提 供 了 3 个 文件 流 类 : ifstream. fstream 和 ofstream. 3X 3 个 类 的 描述 如 表 4-2 
所 示 。 


表 4-2 三 个 文件 流 类 的 描述 


ifstream 该 类 表示 输入 文件 流 ， 用 于 从 文件 读 取信 息 


该 类 表示 输出 文件 流 ， 用 于 创建 文件 并 向 文件 写 入 信息 
fstream 该 类 通常 表示 文件 流 ， 且 同时 具有 ofstream 和 ifstream 两 种 功能 ， 意 味 着 它 可 以 创建 
文件 、 向 文件 写 入 信息 、 从 文件 读 取信 息 


值得 注意 的 是 ， 要 在 C++ 中 进行 文件 处 理 ， 必 须 在 C++ 源 代码 文件 中 包含 头 文件 <fstream>。 
此 外 ，C++ 新 标准 中 ， 头 文件 都 把 .h 去 掉 了 ， 如 #include<fstream.h> 现 在 要 用 : 





#include<fstream> 

using namespace std; 

同时 要 把 标准 命名 空间 加 上 。 但 是 它们 两 个 并 不 是 完全 等 价 的 。 在 旧 头 文件 里 的 fstream.h， 如 
果 使 用 ifstream file 的 默认 参数 声名 一 个 输入 文件 流 ， 当 这 个 要 读 的 file 文件 不 存在 时 ， 会 自动 创 
建 一 个 空 文件 ， 从 而 给 判断 文件 是 否 存在 造成 了 很 多 麻烦 。 如 果 使 用 新 标准 fstream， 就 不 会 创建 
空 文件 ， 从 而 可 以 用 while(!file) 来 判断 文件 是 否 存在 ， 返 回 数值 来 指导 程序 运行 。 

类 似 的 ， 头 文件 ostream.h 与 iostream 是 不 同 的 。iostream.h 在 旧 的 标准 C++ 中 使 用 ， 新 标准 中 
用 头 文件 iostream， 还 要 引用 命名 空间 std。iostream.h 慢 慢 地 不 再 使 用 了 ， 比 如 微软 的 VC6 可 以 使 
用 iostream.h, VS 2008 已 经 不 能 使 用 iostream.h 了 。 好 像 没有 .h 结尾 的 不 习惯 称 为 头 文件 ， 但 与 
时 俱 进 吧 ， 头 文件 不 一 定 要 .h。 


4.9.3 打开 文件 


在 从 文件 读 取信 息 或 者 向 文件 写 入 信息 之 前 ， 必 须 先 打开 文件 。ofstream 和 fstream 对 象 都 可 
以 用 来 打开 文件 进行 写 操作 ， 如 果 只 需要 打开 文件 进行 读 操作 ， 就 使 用 ifstream 对 象 。 被 打开 的 文 
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件 在 程序 中 由 一 个 流 对 象 Cstream object) 来 表示 〈 这 些 类 的 一 个 实例 ) ， 而 对 这 个 流 对 象 所 做 的 
任何 输入 输出 操作 实际 上 就 是 对 该 文件 所 做 的 操作 。 要 通过 一 个 流 对 象 打开 一 个 文件 , 我 们 使 用 它 
的 成 员 函 数 open), open) 函数 是 fstream, ifstream 和 ofstream 对 象 的 一 个 成 员 ， 该 函数 声明 如 
F: 





void open (const char *filename, ios::openmode mode); 


其 中 ,第 一 参数 指定 要 打开 的 文件 的 名 称 和 位 置 ， 第 二 个 参数 定义 文件 被 打开 的 模式 。 文 件 打 
开 模 式 如 表 4-3 所 示 。 


表 4-3 文件 打开 模式 


追加 模式 。 所 有 写 入 都 追加 到 文件 末尾 
文件 打开 后 定位 到 文件 末尾 


Ee premis uA 


如 果 该 文件 已 经 存在 ， 其 内 容 将 在 打开 文件 之 前 被 截断 ， 即 把 文件 长 度 设 为 0 





可 以 把 以 上 两 种 或 两 种 以 上 的 模式 结合 使 用 。 例 如 ， 如 果 想 要 以 写 入 模式 打开 文件 ， 并 希望 
截断 文件 ， 以 防止 文件 已 存在 ， 那 么 可 以 使 用 下 面 的 代码: 


ofstream outfile; 
outfile.open("file.dat", ios::out | ios::trunc ); 


类 似 的 ， 你 如 果 想 要 打开 一 个 文件 用 于 读 写 ， 可 以 使 用 下 面 的 代码 : 


fstream afile; 
afile.open("file.dat", ios::out | ios::in ); 


又 比如 ， 如 果 想 要 以 二 进 制 方式 打开 文件 “example.bin” 来 写 入 一 些 数据 ， 可 以 这 样 写 : 


ofstream file; 
file.open ("example.bin", ios::out | ios::app | ios::binary); 


ofstream、ifstream 和 fstream 类 的 成 员 函 数 open 都 包含 一 个 默认 打开 文件 的 方式 ， 这 3 个 类 
的 默认 方式 各 不 相同 ， 如 表 4-4 所 示 。 


表 4-4 ofstream、ifstream 和 fstream 三 个 类 的 默认 方式 





类 参数 的 默认 方式 


ofstream ios::out | ios::trunc 


ios::in | ios::out 
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只 有 在 函数 被 调用 时 没有 声明 方式 参数 的 情况 下 , 默认 值 才 会 被 采用 。 如果 函数 被 调用 时 声明 
了 任何 参数 ， 默 认 值 将 被 完全 改写 ， 而 不 会 与 调用 参数 组 合 。 

由 于 对 类 ofstream. ifstream 和 fstream 的 对 象 所 进行 的 第 一 个 操作 通常 都 是 打开 文件 ， 因 此 
这 些 类 都 有 一 个 构造 函数 可 以 直接 调用 open 函数 ， 并 拥有 同样 的 参数 。 这 样 ， 我 们 就 可 以 通过 以 
下 方式 进行 与 上 面 同 样 的 定义 对 象 和 打开 文件 的 操作 : 


ofstream file ("example.bin", ios::out | ios::app | ios::binary); // 定 义 对 象 
的 同时 直接 打开 文件 


两 种 打开 文件 的 方式 都 是 正确 的 。 
另外 ， 我 们 可 以 通过 调用 成 员 函 数 is_open() 来 检查 一 个 文件 是 否 已 经 被 顺利 地 打开 了 : 


bool is open(); 


该 函数 返回 一 个 布尔 (bool) 值 ， 为 真 Crue) 代表 文件 已 经 被 顺利 打开 ， 为 假 (false) 则 相反 。 


4.9.4 关闭 文件 

当 文 件 读 写 操作 完成 之 后 ， 我 们 必须 将 文件 关闭 以 使 文件 重新 变 为 可 访问 的 。 关 闭 文件 需要 
调用 成 员 函 数 close), 它 负责 将 缓存 中 的 数据 排放 出 来 并 关闭 文件 .close() 函数 是 ftream ifstream 
和 ofstream 对 象 的 一 个 成 员 函 数 ， 声 明 如 下 : 

void close () 

这 个 函数 一 旦 被 调用 ， 原 先 的 流 对 象 Cstream object) 就 可 以 被 用 来 打开 其 他 的 文件 了 ， 这 个 
文件 也 就 可 以 重新 被 其 他 的 进程 (process) 所 访问 了 。 为 防止 流 对 象 被 销毁 时 还 联系 着 打开 的 文件 ， 
析 构 函数 (destructor) 将 会 自动 调用 关闭 函数 closes 
49.5 BAXI 


在 C++ 编程 中 , 我 们 使 用 流 插入 运算 符 (<<) 向 文件 写 入 数据 ， 就 像 使 用 该 运算 符 输出 信息 
到 屏幕 上 一 样 。 唯 一 不 同 的 是 ， 在 这 里 使 用 的 是 ofstream 或 fstream 对 象 ， 而 不 是 cout 对 象 。 


4.9.6 读 取 文件 

在 C++ 编程 中 , 我 们 使 用 流 提 取 运 算 符 (>>) 从 文件 读 取信 息 ， 就 像 使 用 该 运算 符 从 键盘 输 
入 信息 一 样 。 唯 一 不 同 的 是 ， 在 这 里 使 用 的 是 ifstream 或 fstream 对 象 ， 而 不 是 cin 对 象 。 

下 面 我 们 来 看 一 个 小 例子 ， 以 读 写 模式 打开 一 个 文件 。 在 向 文件 afile.dat 写 入 用 户 输入 的 信 
息 之 后 ， 程 序 从 文件 读 取 信息 ， 并 将 其 输出 到 屏幕 上 。 
【 例 4.13】 用 C++ 流 的 方式 读 写 文件 

(1) 打开 UE， 然 后 输入 内 容 如 下 : 

#include <fstream> 


#include <iostream> 
using namespace std; 
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int main () 


t 
char data[100]; 
// 以 写 模式 打开 文件 
ofstream outfile; 
outfile.open ("afile.dat"); 
cout «« "Writing to the file" «« endl; 
cout «« "Enter your name: "; 
cin.getline(data, 100); 
// 向 文件 写 入 用 户 输入 的 数据 
outfile << data << endl; 
cout << "Enter your age: "; 
cin »» data; 
cin.ignore(); 
// 再 次 向 文件 写 入 用 户 输入 的 数据 
outfile << data «« endl; 
// 关闭 打开 的 文件 
outfile.close(); 
// 以 读 模式 打开 文件 
ifstream infile; 
infile.open("afile.dat"); 
cout << "Reading from the file" «« endl; 
infile >> data; 
// 在 屏幕 上 写 入 数据 
cout << data << endl; 
// 再 次 从 文件 读 取 数 据 ， 并 显示 它 
infile >> data; 
cout «« data «« endl; 
// 关闭 打开 的 文件 
infile.close(); 
return 0; 

l 


"T 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 : g+ -o test test.cpp， 然 后 运行 test， 运 行 结 
AUT: 
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[root@localhost test]# g++ -o test test.cpp 
[rootélocalhost test]# ./test 

Writing to the file 

Enter your name: zww 

Enter your age: 61 

Reading from the file 

ZWW 

61 


可 以 看 到 在 同 目录 下 生成 了 一 个 文件 afile.dat， 查 看 里 面 的 内 容 可 得 : 


[root@localhost test]# cat afile.dat 
ZWW 
61 


上 面 的 例子 中 使 用 了 cin 对 象 的 附加 函数 ， 比 如 getline0 函 数 从 外 部 读 取 一 行 ，ignore() 函数 
会 忽略 掉 之 前 读 语 句 留 下 的 多 余 字 符 。 


49.7 文件 位 置 指针 
先 复习 一 下 C 语言 中 的 文件 指针 定位 函数 fseek()， 其 声明 如 下 : 
int fseek(FILE *fp, LONG offset, int origin): 


其 中 ， 印 是 文件 指针 ; offset 是 相对 于 origin 规定 的 偏 移 位 置 量 ，origin 是 指针 移动 的 起 始 位 
置 ， 可 设置 为 以 下 3 种 情况 : 


€ SEEK SET: 文件 开始 位 置 。 
€ SEEK CUR: 文件 当前 位 置 。 
€ SEEK END: 文件 结束 位 置 。 


当 offset 是 向 文件 尾 方向 偏 移 的 时 候 ， 无 论 偏 移 量 是 否 超出 文件 尾 ，fseek 都 是 返回 0， 当 偏 移 
量 没 有 超出 文件 尾 的 时 候 ,文件 指针 指向 正常 的 偏 移 地 址 ， 当 偏 移 量 超出 文件 尾 的 时 候 , 文件 指针 
指向 文件 尾 ， 并 不 会 返回 偏 移出 错 -1 值 。 当 offset 是 向 文件 头 方向 偏 移 的 时 候 ， 如 果 偏 移 量 没有 超 
出 文件 头 ， 就 是 正常 偏 移 ， 文 件 指针 指向 正确 的 偏 移 地 址 ，fseek 返回 值 为 0， 当 偏 移 量 超出 文件 
头 时 ，fseek 返回 出 错 -1 值 ， 文 件 指 针 不 变 ， 还 是 处 于 原来 的 地 址 。 

在 C++ 中 ，istream 和 ostream 也 提供 了 用 于 重新 定位 文件 位 置 指针 的 成 员 函 数 seekg 和 
seekp，seekg 用 于 设置 输入 文件 流 的 文件 流 指针 位 置 ， 而 seekp 用 于 设置 输出 文件 流 的 文件 流 指针 
位 置 。 它 们 的 声明 如 下 : 

ostream& seekp( streampos pos ); 

ostream& seekp( streamoff off, ios::seek dir dir ); 

istream& seekg( streampos pos ); 

istream& seekg( streamoff off, ios::seek dir dir ); 

其 中 , pos 表示 新 的 文件 流 指 针 位 置 值 ，off 表示 需要 偏 移 的 值 ，dir 表示 搜索 的 起 始 位 置 , dir 
参数 用 于 对 文件 流 指 针 的 定位 操作 ， 代 表 搜 索 的 起 始 位 置 在 ios 中 定义 的 枚 举 类 型 : 
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enum seek dir (beg, cur, end); 


每 个 枚 举 常量 的 含义 如 下 。 


€  ios:beg: 文件 流 的 起 始 位 置 (默认 值 ， 从 流 的 开头 开始 定位 ) 。 


€ ios::cur: 文件 流 的 当前 位 置 。 
€ ios::end: 文件 流 的 结束 位 置 。 


文件 位 置 指针 是 一 个 整数 值 ， 指 定 了 从 文件 的 起 始 位 置 到 指针 所 在 位 置 的 字 节 数 。 下 面 是 关 


于 定位 “get” 文 件 位 置 指 针 的 代码 片段 。 


// 定位 到 fileobject 的 第 n 个 字 节 (假设 是 ios: :beg) 
fileObject.seekg( n ); 


// 把 文件 的 读 指针 从 £ileobject 当前 位 置 向 后 移 n 个 字 节 


fileObject.seekg( n, ios::cur ); 


// 把 文件 的 读 指针 从 £ileobject 末尾 往 回 移 n 个 字 节 


fileObject.seekg( n, ios::end ); 


// 定位 到 £ileObject 的 末尾 
fileObject.seekg( 0, ios::end ); 


下 面 的 例子 使 用 这 些 函数 来 获得 一 个 二 进 制 文件 的 大 小 。 
【 例 4.14】 获 得 二 进 制 文件 的 大 小 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
#include <fstream> 
using namespace std; 


const char * filename = "afile.dat"; // afile.dat 前 面 的 例子 已 经 生成 了 


int main() ( 
long 1, m; 
ifstream file(filename, ios::in | ios::binary); 
1 = file.tellg(); 
file.seekg(0, ios::end); 
m = file.tellg(); 
file.close(); 
cout << "size of " «« filename; 
cout << Wt Ta Nm I Vtos nn 
return 0; 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 


然后 运行 test， 运 行 结 
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果 如 下 : 


[root@localhost test]# g++ -o test test.cpp 
[root@localhost test]# ./test 
size of afile.dat is 7 bytes. 


假设 当前 目录 下 有 一 个 文件 afile.dat, 大 小 为 7 字 节 , 上 面 的 代码 就 可 以 判断 出 其 大 小 。 同 时， 
我 们 可 以 在 命令 行 下 验证 一 下 : 


[root@localhost test]# 11 afile.dat 
-rw-r--r-- 1 root root 7 3 月 15 21:49 afile.da 


可 以 看 出 ， 果 然 是 7 字 节 。 


4.9.8 状态 标志 符 的 验证 


一 些 验证 流 的 状态 的 成 员 函 数 有 时 候 会 大 大 方便 我 们 的 开发 ， 比 如 eof ， 它 是 ifstream 从 类 
ios 中 继承 过 来 的 ， 当 到 达 文 件 末尾 时 返回 true。 除 了 eof0) 以 外 ， 还 有 一 些 验证 流 的 状态 的 成 员 函 
数 (所 有 都 返回 bool 型 返回 值 ) : 


bool bad(); 

如 果 在 读 写 过 程 中 出 错 ， 就 返回 true; 例如， 当 我 们 要 对 一 个 打开 不 是 为 写 状态 的 文件 进行 写 
入 时 ， 或 者 要 写 入 的 设备 没有 剩余 空间 的 时 候 。 

bool fail(); 


除了 与 bad() 同样 的 情况 下 会 返回 true. 以 外 , 格式 错误 时 也 返回 true ， 例 如 想 要 读 入 一 个 整 
数 ， 而 获得 了 一 个 字母 的 时 候 。 


bool eof() 


如 果 读 文件 到 达 文 件 末尾 ， 返 回 true。 





bool good () 


这 是 最 通用 的 ， 如 果 调用 以 上 任何 一 个 函数 返回 tue， 此 函数 返回 false o 
要 想 重 置 以 上 成 员 函 数 所 检查 的 状态 标志 ， 你 可 以 使 用 成 员 函 数 clear()， 该 函数 没有 参数 。 


【 例 4.15】 判 断 文 件 是 否 达到 末尾 
(1) 打开 UE， 输 入 代码 如 下 : 





#include <iostream> 
#include <fstream> 
using namespace std; 


#include <stdlib.h> 
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int main() ( 

char buffer[256]; 

ifstream examplefile("afile.dat"); // afile.dat 前 面 的 例子 已 经 生成 了 

if (!examplefile.is open()) 

( cout << "Error opening file"; exit(1); } 

while (!examplefile.eof()) ( // 判 断 文件 是 否 达到 末尾 
examplefile.getline (buffer, 100); 
cout «« buffer «« endl; 

) 

return 0; 


) 

(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test， 运 行 结 
果 如 下 : 

[root@localhost test]# g++ -o test test.cpp 

[root@localhost test]# ./test 
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4.9.9 读 写 文件 数据 块 


C++ 的 IO 中 提供 了 write 和 read 函数 ， 分 别 从 流 中 读 取 数据 和 向 流 写 入 数据 。 第 一 个 函数 
Cwrite) 是 ostream 的 一 个 成 员 函 数 ， 都 是 被 ofstream 所 继承 的 。 而 read 是 istream 的 一 个 成 员 
函数 ， 被 ifstream 所 继承 。 类 fstream 的 对 象 同 时 拥有 这 两 个 函数 。 它 们 的 原型 是 : 


ostream& write ( char * buffer, streamsize size ); 
istream read ( char * buffer, streamsize size ); 


这 里 buffer 是 一 块 内 存 的 地 址 ， 用 来 存储 要 写 入 或 读 出 的 数据 。 参 数 size 是 一 个 整数 值 ， 表 
示 要 从 缓存 Cbuffer) 中 读 出 或 写 入 的 字符 数 。 
下 面 两 个 小 例子 演示 了 这 两 个 函数 的 使 用 。 


【 例 4.16】 复 制 文件 
(1) 打开 UE， 输 入 代码 如 下 : 


// Copy a file 
#include <fstream> // std::ifstream, std::ofstream 


int main() { 
std: :ifstream infile("myfile.txt", std::ifstream: :binary); 
std: :ofstream outfile("new.txt", std::ofstream::binary); 


// get size of file 
infile.seekg (0, infile.end); 
long size = infile.tellg(); 
infile.seekg(0); 
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// allocate memory for file content 
char* buffer = new char[sizel; 


// read content of infile 
infile.read(buffer, size); 


// write to outfile 
outfile.write(buffer, size); 


// release dynamically-allocated memory 
delete[] buffer; 


outfile.close(); 
infile.close(); 
return 0; 


) 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test， 
果 如 下 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
[root@localhost test]# cat new.txt 

Linux 

boy 


【 例 4.17】 读 取 文件 到 内 存 
(1) 打开 UE， 输 入 代码 如 下 : 


// read a file into memory 
#include <iostream> // std::cout 
#include «fstream» // std::ifstream 


int main() ( 


Std::ifstream is("myfile.txt", std::ifstream::binary); 
adis 

// get length of file: 

is.seekg(0, is.end); 

int length - is.tellg(); 

is.seekg(0, is.beg); 


char * buffer - new char[length]; 
Std::cout «« "Reading " «« length «« " characters... "; 
// read data as a block: 


is.read(buffer, length); 


Af (xs) 
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Std::cout «« "all characters read successfully."; 
else 

std::cout << "error: only " << is.gcount() << " could be read"; 
is.close(); 


// ...buffer contains the entire file... 
delete[] buffer; 


} 
(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test， 运 行 结 
果 如 下 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
Reading 18 characters... all characters read successfully. 


4.0 文件 编程 中 的 其 他 操作 


4.10.1 获取 文件 有 关 信 息 

Linux 一 线 开发 中 ,经 常会 碰 到 和 文件 打交道 的 情况 ， 除 了 前 面 介绍 的 读 写 文件 外 ， 获 取 文件 
的 相关 信息 (比如 类 型 、 大 小 、 是 否 存在 ) 也 经 常会 遇 到 。Linux 用 函数 stat 来 获取 文件 相关 信息 ， 
该 函数 声明 如 下 : 

#include <sys/stat.h> 


#include <unistd.h> 
int stat(const char *file name, struct stat *buf); 


其 中 ， 参 数 fe_name 指向 文件 名 ; buf 指向 结构 体 stat， 存 放 文件 属性 信息 。 结 构 体 stat 定义 
如 下 : 


struct stat { 


dev t st dev; // 文 件 的 设备 编号 

ino t st ino; // 节 点 

mode t st mode; // 文 件 的 类 型 和 存 取 的 权限 

nlink t st nlink; // 连 到 该 文件 的 硬 链接 数目 ， 刚 建立 的 文件 值 为 1 
uid 七 st uid; // Ri 1p 

gid t st gid; // 组 ID 

dev 七 st rdev; // (设备 类 型 ) 若 此 文件 为 设备 文件 ， 则 为 其 设备 编号 
oE t st_size; // 文 件 字 节 数 (文件 大 小 ) 


unsigned long st blksize;  // 块 大 小 (文件 系统 的 I/0 缓冲 区 大 小 ) 
unsigned long st blocks; // 块 数 

time t st atime; // 最 后 一 次 访问 时 间 

time 七 st mtime; // 最 后 一 次 修改 时 间 
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time 七 st ctime; // 最 后 一 次 改变 时 间 ( 指 属性 ) 
NH 


如 果 函 数 执行 成 功 ， 就 返回 0， 失 败 返回 -1， 错 误 代码 存 于 erno 中 ， 和 常见 错误 代码 如 下 : 


ENOENT: 参数 file name 指定 的 文件 不 存在 。 

ENOTDIR: 路 径 中 的 目录 存在 但 却 非 真正 的 目录 。 

ELOOP: 和 欲 打开 的 文件 有 过 多 符号 连接 问题 ， 上 限 为 16 个 符号 连接 。 
EFAULT: 参数 buf 为 无 效 指针 ， 指 向 无 法 存在 的 内 存 空 间 。 
EACCESS: 存 取 文 件 时 被 拒绝 。 

ENOMEM: 核心 内 存 不 足 。 

ENAMETOOLONG: 参数 file_name 的 路 径 名 称 太 长 。 


这 些 宏 的 定义 可 以 在 include/asm-generic/errno-base.h 中 找到 ， 比 如 : 
#define ENOENT 2 /* No such file or directory */ 


我 们 可 以 通过 stat 获取 文件 的 类 型 和 文件 大 小 等 信息 。 文 件 类 型 有 : 普通 文件 、 目 录 文 件 、 块 
特殊 文件 、 字 符 特殊 文件 、FIFO、 套 接 字 和 符号 链接 。 


【 例 4.18】 获 取 文 件 的 大 小 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <sys/stat.h> 
#include <unistd.h> 
#include <stdio.h> 


int main() { 
struct stat buf; 
stat("/etc/hosts", &buf); 
printf("/etc/hosts file size = $dWMn", buf.st size); 


stat("/zww/test/myfile.txt", &buf); 
printf("/zww/test/myfile.txt size = $dWMn", buf.st size); 
) 


上 面 的 代码 中 ， 分 别 用 stat 函数 获取 了 2 个 文件 的 属性 信息 ， 然 后 打印 了 两 个 文件 的 大 小 。 注 
意 这 2 个 文件 必须 存在 。 
(2) 上 传 到 Linux， 然 后 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

/etc/hosts file size = 158 
/zww/test/myfile.txtfile size — 18 


我 们 可 以 再 用 命令 1 来 验证 一 下 : 
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[root@localhost ~]# 11 /etc/hosts 

=p- rr, 1 root root 158:6. 7 2013 /eto/hosts 
[root@localhost test]# 11 /zww/test/myfile.txt 

-rwxr-Sr-x. 1 root root 18 3 26 13:17 /zww/test/myfile.txt 


TJ IL, /etc/hosts 的 大 小 的 确 为 158 FH, /zww/test/myfile.txt 的 大 小 的 确 为 18 字 节 。 


【 例 4.19】 判 断 文件 是 否 存在 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <sys/stat.h> 
#include <unistd.h> 
#include <stdio.h> 
#include <errno.h>//for ENOENT 
#include <string.h>//for memset 
int main() 
{ 
struct stat st; 
memset(&st, 0, sizeof(st)); 
if (!stat("/zww/test/myfile.txt", &st)) // 如 果 myfil .txt 不 存在 ，stat 就 会 返回 
非 0 
{ 
if (st.st size »- 0) // 加 了 一 层 保 证 
{ 
printf("/zww/test/myfile.txt exists.\n"); 
} 
) 
else if(ENOENT == errno) 
printf("/zww/test/myfile.txt does NOT exist:$dWn",errno); 
) 


代码 中 ， 我 们 还 用 stst size 来 判断 文件 大 小 是 否 大 于 等 于 0， 这 样 可 以 加 一 层 保障 。 或 者 用 
fopen 也 可 加 一 层 保障 ， 比 如 : 
if (stat("/zww/test/myfile.txt", &stb) == 0) 
i 
FILE *fd = fopen("/zww/test/myfile.txt", "r"); 
iE Ed) 


t 
// 文 件 存在 


) 
) 


有 朋友 或 许 会 想 ， 那 直接 用 fopen 判断 文件 是 否 存在 不 就 行 了 ? 这 个 会 有 例外 情况 ， 比 如 一 个 
文件 存在 ， 但 没有 读 权限 的 时 候 ， 此 时 就 不 能 用 fopen 去 判断 是 否 存在 了 。 其 实 判 断 文件 是 否 存在 
更 简单 的 方法 是 用 access 函数 ， 限 于 篇 幅 ， 不 再 展开 了 。 


(2) 上 传 到 Linux， 然 后 在 命令 行 下 编译 运行 : 
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[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 
/zww/test/myfile.txt exists. 


4.10.2 ”创建 和 删除 文件 目录 项 

首先 必须 要 和 弄 清楚 目录 项 和 inode 节点 两 个 概念 (本 章 开头 讲 过 了 ， 这 里 不 再 堵 述 ) 。 目 录 文 
件 中 存放 的 是 文件 名 和 对 应 的 inode 号 码 ， 统 称 为 目录 项 。link 和 unlink 函数 分 别 用 来 创建 硬 链接 
和 删除 硬 链 接 。link 函数 创建 一 个 新 目录 项 ， 并 且 增 加 一 个 链接 数 。unlink 函数 删除 目录 项 ， 并 且 
减少 一 个 链接 数 。 如 果 链 接 数 达到 0 并 且 没 有 任何 进程 打开 该 文件 ,该 文件 内 容 才 被 真正 删除 。 如 
RE unlink 之 前 没有 close， 那 么 依旧 可 以 访问 文件 内 容 。 两 个 函数 中 的 操作 都 是 原子 操作 。 总 之 ， 
真正 影响 链接 数 的 操作 是 link、unlink 以 及 open 的 创建 。 删 除 文件 内 容 的 真正 含义 是 文件 的 链接 
数 为 0。 

link 函数 声明 如 下 : 





int link(const char *oldpath,const char * newpath); 


其 中 ， 参 数 oldpath 为 源 文件 路 径 名 ， 参 数 newpath 为 新 文件 路 径 名 。 当 oldpath 不 存在 或 者 
newpath 存在 但 调用 失败 时 返回 -1， 调 用 成 功 时 返回 0。 
unlink 函数 的 声明 如 下 : 


int unlink(const char *pathname); 


其 中 , 参数 pathname 为 要 删除 目录 项 的 文件 路 径 名 。 如 果 函 数 执行 成 功 就 返回 0, 否则 返回 -1。 
我 们 知道 Linux 中 是 用 inode 节点 来 区 分 文件 的 ， 当 删除 一 个 文件 的 时 候 ， 系 统 并 不 一 定 就 会 
释放 inode 节点 的 内 容 。 当 满足 下 面 的 要 求 的 时 候 ， 系 统 才 会 释放 inode 节点 的 内 容 。 


(1) inode 中 记录 指向 该 节点 的 硬 链接 数 为 0。 
(2) 没有 进程 打开 指向 该 节点 的 文件 。 


使 用 unlink 函数 删除 文件 的 时 候 ， 只 会 删除 目录 项 ， 并 且 将 inode 节点 的 硬 链接 数目 减 1， 并 
不 一 定 会 释放 inode 节点 。 

如 果 此 时 没有 进程 正在 打开 该 文件 或 者 有 其 他 文件 指向 该 inode 节点 ， 该 inode 节点 将 会 被 释 
放 ; 如 果 此 时 有 进程 正在 打开 一 个 文件 ， 而 此 时 使 用 unlink 删除 了 该 文件 ， 那 么 此 时 只 是 删除 了 
目录 项 ， 并 没有 释放 ， 因 为 此 时 仍然 有 进程 在 打开 这 个 文件 。 

unlink 函数 的 另 一 个 用 途 就 是 用 来 创建 临时 文件 , 如 果 在 程序 中 使 用 open 创建 了 一 个 文件 后 ， 
立即 使 用 unlink 函数 删除 文件 ， 由 于 此 时 进程 正在 打开 该 文件 ， 因 此 系统 并 不 会 释放 该 文件 的 
inode 节点 ， 而 只 是 删除 其 目录 项 。 当 进程 退出 时 ， 该 inode 节点 将 会 立即 被 释放 。 临 时 文件 可 以 
用 在 进程 间 通 信 的 有 名 管道 通信 中 。 
【 例 4.20] link 和 unlink 的 简单 用 法 

(1) 打开 UE， 输 入 代码 如 下 : 








#include <stdio.h> 
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#include <sys/types.h> 
#include <sys/stat.h> 
#include «fcntl.h» 
#include <unistd.h> 
int main() 
ü 
int fd; 
struct stat buf; 
stat("test.txt", &buf); 
printf("l.link =% dvn"，buf.st_nlink) ;//1. 未 打开 文件 之 前 测试 链接 数 


fd = open ("test.txt"，0O RDONLY);//2. 打 开 已 存在 的 文件 test .txt 
stat("test.txt", &buf); 
printf("2.link =% d\n", buf.st_nlink) ;// 测 试 链接 数 


close (fd) ;//3. 关 闭 文件 test .txt 
stat("test.txt", &buf); 
printf("3.link =% d\n", buf.st_nlink) ;// 测 试 链接 数 


link ("test.txt"，"test2.txt") ;7//4. 创 建 硬 链接 test2 .txt 
stat("test.txt", &buf); 
printf("4.link =% d\n", buf.st_nlink) ;// 测 试 链接 数 


unlink("test2.txt");//5. 删 除 Lest2 .txt 
stat("test.txt", &buf); 
printf("5.link =% d\n", buf.st_nlink) ;// 测 试 链接 数 


//6. 重 复 步骤 2 // 重 新 打开 test.txt 

fd = open ("test.txt"，O0_RDONLY) ;// 打 开 已 存在 的 文件 test .txt 
stat("test.txt", &buf); 

printf("6.link =% d\n", buf.st_nlink) ;// 测 试 链接 数 


unlink ("test .txt");//7. 删 除 test .txt 
fstat (fd, &buf); 
printf("7.link =% d\n", buf.st_nlink) ;// 测 试 链接 数 


close (fd) ;//8. 此 步骤 可 以 不 显 式 写 出 ， 因 为 进程 结束 时 ， 打 开 的 文件 自动 被 关闭 
} 


(2) 上 传 到 Linux， 然 后 在 命令 行 下 用 touch 命令 新 建 一 个 testtxt 空 文件 ， 再 编译 运行 : 


[rootelocalhost test]# touch test.txt 
[rootGlocalhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 


1.link = 1 
2.link = 1 
3.link = 1 
4.link = 2 
5.link = 1 
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6.link 
7.link 


我 们 对 每 一 步 结 果 进 行 分 析 。 
顺 次 执行 代码 中 注释 的 8 个 步骤 ， 结 果 如 下 : 


.link-i 

.linkel ”//open 不 影响 链接 数 

.link=1 ”//close 不 影响 链接 数 

.link=2 ”//1ink 之 后 链接 数 加 1 

.link=1 ”//unlink 后 链接 数 减 1 

.link=1 ”// 重 新 打开 ， 链 接 数 不 变 

.link-0 ”//unlink 之 后 再 减 1， 此 处 我 们 改 用 fstat 函 数 而 非 stat， 因 为 un1ilnk 已 经 删除 文 
件 名 ， 所 以 不 可 以 通过 文件 名 访问 , 但 是 fd 仍然 是 打开 着 的 ， 文 件 内 容 还 没有 被 真正 删除 ， 依 旧 可 以 使 用 fd 
获得 文件 信息 


执行 步骤 8， 文件 内 容 被 删除 。 


üL 
0 


Oow 必 wm 


第 5 章 多 进程 编程 


HEFE (Process) 是 操作 系统 结构 的 基础 。 进 程 是 一 个 具有 独立 功能 的 程序 对 某 个 数据 集 在 处 
理 机 上 的 执行 过 程 ， 进 程 也 是 作为 资源 分 配 的 一 个 基本 单位 。Linux 作为 一 个 多 用 户 、 多 任务 的 操 
作 系统 ， 必 定 支持 多 进程 。 多 进程 是 现代 操作 系统 的 基本 特征 。 


5.1. 进程 的 基本 概念 


进程 是 现代 操作 系统 重要 的 特征 之 一 。 操 作 系统 在 裸 机 硬件 层面 之 上 提供 了 更 为 简单 、 可 靠 、 
安全 、 高 效 的 功能 ， 而 操作 系统 的 首要 功能 就 是 管理 和 协调 各 种 计算 机 系统 资源 ， 包 括 物 理 的 和 虚 
拟 的 资源 。 为 了 提高 计算 机 系统 中 各 种 资源 的 利用 效率 ， 现 代 操 作 系 统 广泛 采用 了 多 道 程序 技术 
使 多 种 硬件 资源 能 够 并 行 工作 。 因 此 , 程序 的 并 发 执行 以 及 多 任务 共享 资源 成 为 现代 操作 系统 的 了 
要 特点 。 为 了 描述 计算 机 程序 的 执行 过 程 和 作为 资源 分 配 的 基本 单位 , 便 引进 了 “进程 ”这 个 概念 。 

从 提出 进程 这 一 概念 以 来 ， 人 们 已 经 对 进程 下 过 许多 种 定义 ， 尽 管 侧重 点 不 尽 相 同 ， 但 都 注 
重 这 一 点 ， 就 是 进程 是 一 个 动态 的 执行 过 程 。 因 此 可 以 这 样 定义 进程 的 概念 : 进程 是 一 个 具有 独立 
功能 的 程序 对 某 个 数据 集 在 处 理 机 上 的 执行 过 程 , 进程 也 是 资源 分 配 的 基本 单位 。 为 了 更 好 地 理解 
进程 的 概念 ， 有 必要 将 进程 与 程序 的 概念 做 一 下 比较 。 


(1) 进程 和 程序 是 相辅相成 的 。 程 序 是 进程 的 组 成 部 分 之 一 ， 一 个 进程 的 运行 目标 是 执行 它 
所 对 应 的 程序 ， 如 果 没 有 程序 ， 进 程 就 失去 了 其 存在 的 意义 。 一 个 程序 也 可 以 由 多 个 进程 组 成 。 

(OD 进程 是 一 个 动态 概念 ， 而 程序 则 是 一 个 静态 概念 。 程 序 是 指令 的 有 序 集合 ， 其 本 身 没 有 
任何 运行 的 含义 , 是 一 个 静态 的 概念 。 进 程 是 程序 在 处 理 机 上 的 一 次 执行 过 程 ， 它 是 一 个 动态 的 概 
念 ， 动 态 地 产生 、 执 行 ， 然 后 消亡 。 因 此 进程 的 存在 也 是 暂时 的 。 

(3) 进程 具有 并 行 性 特征 ， 而 程序 则 没有 。 进程 具 有 并 行 特征 的 两 个 方面 : 独立 性 和 异步 性 。 
独立 性 是 指 ， 进 程 是 一 个 相对 完整 的 资源 分 配 单 位 。 异 步 性 是 指 ， 每 个 进程 按照 各 自 独立 的 、 不 可 
预知 的 速度 向 前 推进 。 显 然 程序 不 反映 执行 过 程 ， 所 以 不 具有 并 行 性 。 





是 


5.2 ”进程 的 描述 


从 构成 要 素来 看 ， 进 程 由 3 部 分 组 成 ， 也 就 是 进程 控制 块 (Process Control Block, PCB) 、 有 
关 的 程序 段 以 及 操作 的 数据 集 。 其 中 进程 控制 块 主要 包括 进程 的 一 些 描述 信息 、 资 源 信息 以 及 控制 
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信息 等 。 系 统 为 每 个 进程 设置 一 个 PCB， 它 是 标识 和 描述 进程 存在 及 相关 特性 的 数据 块 ， 是 进程 
存在 的 唯一 标识 ， 是 进程 动态 特征 的 集中 反映 。 当 创建 一 个 进程 时 ， 系 统 首 先 创建 其 PCB， 然 后 
根据 PCB 中 的 信息 对 进程 实施 有 效 的 管理 和 控制 。 当 一 个 进程 完成 其 功能 之 后 ， 系 统 则 释放 
PCB， 进 程 也 随 之 消亡 。 进 程控 制 块 的 具体 内 容 随 操作 系统 的 不 同 而 有 所 区 别 ， 但 主要 都 应 当 
包括 以 下 信息 。 


(1) 进程 标识 。 每 个 进程 都 有 系统 唯一 的 进程 名 称 或 标识 号 。 在 识别 一 个 进程 时 ， 进 程 名 或 
标识 号 就 代表 该 进程 。 

(2) 状态 信息 。 指 明 进 程 当前 所 处 的 状态 ， 作 为 进程 调度 、 分 配 处 理 机 的 依据 。 进 程 在 活动 
期 间 有 3 种 基本 的 状态 , 可 分 为 就 绪 状 态 、 执 行 状 态 和 等 待 状态 。 一 个 进程 在 任 一 时 刻 只 能 具有 这 
三 种 状态 中 的 一 种 。 执 行 状 态 表示 该 进程 当前 占有 处 理 机 ， 正 在 处 理 机 上 调度 执行 ; 就 绪 状 态 表 示 
该 进程 已 经 得 到 了 除 处 理 机 之 外 的 全 部 资源 ,准备 占有 处 理 机 ;等 待 状态 则 表示 进程 因 某 种 原因 (等 
待 某 事件 发 生 ) 而 暂时 不 能 占有 处 理 机 。 当然 在 具体 的 系统 中 , 为 了 最 大 可 能 地 提高 资源 的 利用 率 ， 
可 能 会 引进 或 者 进一步 细 分 某 些 状态 。 

COD 进程 的 优先 级 。 进 程 优先 级 是 选取 进程 占有 处 理 机 的 重要 依据 ， 一 般 根据 进程 的 轻重 绥 
急 程度 为 进程 指定 一 个 优先 级 ， 包 括 静 态 或 者 动态 的 优先 级 。 

(4) CPU 现场 信息 。 当 进程 状态 变化 时 (例如 一 个 进程 放弃 使 用 处 理 机 〉 ， 它 需要 将 当时 的 
CPU 现场 保护 到 内 存 中 ， 以 便 再 次 占用 处 理 机 时 恢复 正常 运行 。 包 括 各 种 通用 寄存 器 、 程 序 计数 
器 、 程 序 状态 字 等 。 

(5) 资源 清单 。 每 个 进程 在 运行 时 ， 除 了 需要 内 存 外 ， 还 需要 其 他 资源 ， 如 IO 设备 、 外 存 、 
数据 区 等 。 

C60 队列 指针 。 用 于 将 处 于 同一 状态 或 者 具有 家 族 关系 的 进程 链接 成 一 个 队列 ， 在 该 单元 中 
存放 下 一 进程 PCB 首 地 址 。 

CD 其 他 ， 如 计时 信息 、 记 账 信息 、 通 信 信 息 等 。 


Linux 中 的 每 个 进程 都 由 一 个 task_struct 数据 结构 来 表示 。task_struct 其 实 就 是 通常 意义 上 的 
进程 控制 块 , 或 者 称 为 进程 描述 符 , 系统 正 是 通过 task_stmct 结构 来 对 进程 进行 有 效 管理 和 控制 的 。 
当 系 统 创建 一 个 进程 时 ，Linux 为 新 的 进程 分 配 一 个 task_stmct 结构 ， 进 程 结束 时 ， 又 收回 其 
task struct 结构 ， 进 程 也 随 之 消亡 。 分 配给 进程 的 task_truct 结构 可 以 被 内 核 中 的 许多 模块 (如 调 
度 程 序 、 资 源 分 配 程序 、 中 断 处 理 程序 等 ) 访问 , 并 常 驻 于 内 存 。 在 最 新 发 布 的 Linux 4.14 内 核 中 ， 
Linux 为 每 个 新 创建 的 进程 动态 地 分 配 一 个 task_struct 结构 ， 系 统 所 能 允许 的 最 大 进程 数 是 由 机 器 
所 拥有 的 物理 内 存 的 大 小 决定 的 ， 这 是 对 以 前 版 本 的 改进 。 

Linux 支持 两 种 进程 : 普通 进程 和 实时 进程 。 实 时 进程 具有 一 定 程度 上 的 紧迫 性 ， 应 该 有 一 个 
短 的 响应 时 间 , 更 重要 的 是 , 这 个 响应 时 间 应 该 有 很 小 的 变化 ; 而 普通 进程 则 没有 这 种 限制 。 因此 ， 
调度 程序 需要 区 别 对 待 这 两 类 进程 。 

由 于 task. struct 结构 包含 进程 的 全 部 信息 , 因此 有 必要 来 详细 分 析 task. struct 结构 中 所 包含 的 
内 容 ，task_struct 结构 包含 的 数据 比较 庞大 ， 按 其 功能 主要 可 分 为 几 大 部 分 : 进程 标识 符 信息 、 进 
程 调度 信息 、 进 程 间 通信 信息 、 时 间 和 定时 器 信息 、 进 程 链接 信息 、 文 件 系统 信息 、 虚 拟 内 存 信息 、 
处 理 器 特定 信息 及 其 他 信息 。 
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CD 进程 标识 符 信息 

进程 标识 符 信息 包括 进程 标识 符 、 用 户 标识 符 、 组 标识 符 等 一 些 信 息 。 每 个 进程 都 有 一 个 唯 
一 的 进程 标识 符 (Process ID, PID) ， 内 核 通 过 这 个 标识 符 来 识别 不 同 的 进程 ， 同 时 ， 进 程 标识 符 
也 是 内 核 提 供给 用 户 程序 的 接口 。PID 是 32 位 的 无 符号 整数 ， 存 放 在 进程 描述 符 的 PID 域 中 ， 它 
被 顺序 编号 , 新 创建 进程 的 PID 通常 是 前 一 个 进程 的 PID 加 1, 为 了 与 16 位 硬件 平台 的 传统 UNIX 
系统 保持 兼容 ，Linux 上 人 允许 的 最 大 PID 号 是 32767。 当 内 核 在 系统 中 创建 第 32768 个 进程 时 ， 就 
必须 重新 开始 使 用 闲置 的 PID 号 。 

此 外 ， 每 个 进程 都 属于 某 个 用 户 和 某 个 用 户 组 。 进 程 描述 符 中 定义 了 多 种 类 别 的 用 户 标识 符 
和 组 标识 符 ， 比 如 用 户 标识 符 id) 、 有 效用 户 标识 符 (euid)〉 以 及 组 标识 符 (gid) 、 有 效 组 标 
识 符 (egid) 等 。 这 些 也 都 是 简单 的 数字 ， 主 要 用 于 系统 的 安全 控制 。 


(2) 进程 调度 信息 

调度 程序 利用 这 些 信息 来 决定 系统 中 哪个 进程 最 迫切 需要 运行 ， 并 采用 适当 的 策略 来 保证 系 
统 运转 的 公平 性 和 高 效 性 。 这 些 信息 主要 包括 调度 标志 、 调度 的 策略 、 进 程 的 类 别 、 进 程 的 优先 级 、 
进程 状态 。 其 中 可 能 的 进程 状态 有 : 可 运行 状态 、 可 中 断 的 等 待 状态 、 不 可 中 断 的 等 待 状态 、 暂 停 


(3) 进程 间 通 信 信 息 

在 多 任务 编程 环境 中 ， 进 程 之 间 必 然 会 发 生 多 种 多 样 的 合作 、 协 调 等 ， 因 此 进程 之 间 就 必须 
进行 通信 ， 来 交换 信息 和 交流 数据 。Linux 支持 多 种 不 同形 式 的 进程 间 通 信 机 制 ， 如 信和 号、 管道 ， 
也 支持 System V 进程 间 通 信 机 制 ， 如 信号 量 、 消 息 队 列 和 共享 内 存 等 。 进 程 描述 符 中 主要 有 这 些 
域 与 进程 通信 相关 : sig， 信 号 处 理 函 数 ， 包 括 自 定义 的 和 系统 默认 的 处 理 函 数 ，blocked， 进 程 所 
能 接收 信号 的 位 掩 码 ，sigmask_lock， 信 号 掩 码 的 自 旋 锁 ; semundo， 进 程 信号 量 的 取消 操作 队列 ， 
进程 每 操作 一 次 信号 量 , 都 生成 一 个 对 此 次 操作 的 取消 操作 , 这 些 属于 同一 进程 的 取消 操作 组 成 一 
个 链表 ， 当 进程 异常 终止 时 ， 内 核 就 会 执行 取消 操作 ; semsleeping， 与 信号 量 相关 的 等 待 队 列 ， 每 
一 信号 量 集合 对 应 一 个 等 待 队 列 。 


(4) 进程 链接 信息 

Linux 系统 中 所 有 进程 都 是 相互 联系 的 。 除 了 初始 化 进程 init 外 ， 其 他 所 有 进程 都 有 一 个 父 进 
程 。 可 以 通过 fork 或 clone 系统 调用 来 创建 子 进程 ， 除 了 进程 标识 符 〈PID) 等 必要 的 信息 外 ， 子 
进程 的 task. struct 结构 中 的 绝 大 部 分 信息 都 是 从 父 进程 中 复制 过 来 的 。 每 个 进程 对 应 的 task. struct 
结构 中 都 包含 有 指向 其 父 进 程 和 兄弟 进程 (具有 相同 父 进 程 的 进程 ) 以 及 子 进 程 的 指针 。 有 了 这 些 
指针 ， 进 程 之 间 的 通信 、 协 作 就 更 加 方便 了 。 进 程 的 ask struct 结构 中 主要 有 下 面 这 些 域 记录 了 进 
程 间 的 各 种 关系 。next_task、prev_task 用 于 链 入 进程 双向 链表 的 前 后 指针 ， 系统 的 所 有 进程 组 成 一 
个 双向 循环 链表 。p_opptr、p_pptr、p_cptr、p_ysptr、p_osptr 分 别 表示 指向 祖先 进程 、 父 进程 、 子 
进程 、 兄 弟 进程 的 指针 。Pidhash_next、pidhash_pprev 用 于 链 入 进程 哈 希 表 的 前 后 指针 。 


C5) 时 间 和 定时 器 信息 
内 核 需 要 记录 进程 的 创建 时 间 以 及 在 其 生命 周期 中 消耗 的 CPU 时间。 进程 耗费 的 CPU 时 间 由 
两 部 分 组 成 : 一 是 在 用 户 态 (用户 模式 ) 下 耗费 的 时 间 , 二 是 在 内 核 态 (内 核 模式 ) 下 耗费 的 时 间 。 








多 进程 编程 第 5 党 





每 个 时 钟 滴 答 ， 也 就 是 每 个 时 钟 中 断 ， 内 核 都 要 更 新 当前 进程 耗费 的 时 间 。Linux 支持 与 进程 相关 
的 多 种 间隔 定时 器 ， 包 括 实时 定时 器 、 虚 拟定 时 器 和 概况 定时 器 。 进 程 可 以 通过 系统 调用 来 设 定 定 
时 器 ， 以 便 在 定时 器 到 期 后 向 它 发 送信 号 。 这 些 定时 器 可 以 是 一 次 性 的 或 者 周期 性 的 。 


(6) 文件 系统 信息 

进程 经 常会 访问 文件 系统 资源 ， 打 开 或 者 关闭 文件 ，Linux 内 核 要 对 进程 使 用 文件 的 情况 进行 
记录 。task_struct 结构 中 有 两 个 数据 结构 用 于 描述 进程 与 文件 相关 的 信息 .其 中 , 借 域 是 指向 您 struct 
结构 的 指针 ， 人 i_struct 结构 中 描述 了 两 个 VFS 索引 节点 ， 这 两 个 索引 节点 叫 作 root 和 pwd， 分 
别 指向 进程 的 可 执行 映像 所 对 应 的 主 目录 和 当前 工作 目录 。files 域 用 来 记录 进程 打开 文件 的 文 
件 描述 符 。 


(7) 虚拟 内 存 信息 

Linux 采用 按 需 分 页 的 策略 来 解决 进程 的 内 存 需求 ， 当 物理 内 存 不 足 时 ，Linux 内 存 管理 系统 
需要 把 内 存 中 的 部 分 页 面 交换 到 外 存 。 每 个 进程 都 有 自己 的 虚拟 地 址 空间 〈 内 核 线程 除外 ) ， 用 
mm struct 来 描述 ， 其 中 包含 一 个 指向 若干 个 虚 存 块 的 虚 存 队 列 。 另 外 ，Linux 内 核 还 引入 了 另 一 
个 域 active_mm, 它 指向 活动 地 址 空间 , 但 这 一 空间 并 不 为 该 进程 所 拥有 , 通常 为 内 核 线程 所 使 用 。 
内 核 线程 与 用 户 进程 相 比 不 需要 mm_struct 结构 : 当 用 户 进程 切换 到 内 核 线程 时 ， 内 核 线 程 可 以 直 
接 借用 进程 的 页 表 ， 无 须 重新 加 载 独立 的 页 表 。 内 核 线程 用 active mm 指针 指向 所 借用 进程 的 


mm_struct 结构 。 


(8) 处 理 器 特定 信息 

进程 可 以 看 作 是 系统 当前 执行 状态 的 综合 。 进 程 运行 时 ， 它 将 使 用 处 理 器 的 寄存 器 以 及 堆栈 
等 。 进 程 被 挂 起 时 ， 进 程 的 上 下 文 ， 即 所 有 与 CPU 相关 的 处 理 机 状态 必须 保存 在 它 的 task. struct 
结构 中 。 当 进程 被 调度 重新 运行 时 ， 再 从 中 恢复 这 些 环境 ， 重 新 设 定 上 下 文 ， 也 就 是 恢复 这 些 寄 存 
器 和 堆栈 的 值 。 


5.2.1. 进程 的 标识 符 

进程 标识 符 也 称 进程 识别 码 CProcess Identification， 进 程 ID，PID) ， 可 以 用 来 唯一 表示 某 个 
进程 ， 就 像 我 们 每 个 人 的 身份 证 号 一 样 ， 每 人 都 不 同 。 就 算 几 个 进程 来 自 同一 个 程序 ， 这 些 进程 的 
ID 也 是 不 同 的 。PID 是 进程 运行 时 系统 随机 分 配 的 ， 在 进程 运行 时 ，PID 是 不 会 改变 的 ， 进 程 终 
止 后 ，PID 就 会 被 系统 回收 ， 以 后 可 能 会 被 分 配给 新 运行 的 进程 。 

进程 D 在 系统 中 其 实 就 是 一 个 无 符号 整 型 数值 ， 类 型 是 pidt， 该 类 型 定义 在 
/usr/include/sys/types.h 中 ， 定 义 如 下 : 








#ifndef _ pid t defined 

typedef pid t pid t; 

# define pid t defined 

#endif 

可 以 看 到 pidt 其 实 就 是 _pid t 2877. mi_ pid t fE/usr/nclude/bits/types.h. 中 被 定义 为 
. PID T TYPE 类 型 。 在 文件 /usr/include/bits/typesizes.h 中 可 以 看 到 这 样 的 定义 : 
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#define PID T TYPE S32 TYPE 


可 以 看 出 _PID T TYPE 被 定义 为 _S32_TYPE 类 型 。 在 文件 /usrinclude/bits/types.h 中 ， 我 们 
终于 找到 了 这 样 的 定义 : 


#define S32 TYPE int 
pid t 实 际 上 就 是 一 个 int 型 。 真 是 山 穷 水 尽 疑 无 路 ， 柳 暗 花 明 又 一 村 。 
【 例 5.1】 获 取 pid_t 的 字 节 长 度 
(1) 新 建 一 个 test.cpp， 输 入 代码 如 下 : 


#include <iostream> 

using namespace std; 

int main(int argc, char *argv[]) 

t 
pid t pid; 
cout «« sizeof(pid t) «« endl; 
return 0; 


) 
(2) 在 Linux 下 编译 运行 后 ， 结 果 如 下 : 
sizeof(pid 七 )=4 


可 以 看 到 ， 在 64 位 的 Linux F, pid t 的 字 节 长 度 是 4， 就 是 int 型 的 大 小 。 
我 们 可 以 在 终端 下 用 命令 ps -e 来 查看 所 有 进程 的 ID， 比 如 : 


[root@localhost ~]# ps -e 


PID TIY TIME CMD 
HS 00:00:26 systemd 
202 00:00:00 kthreadd 
352 00:00:11 ksoftirqd/0 
Re 6s 00:00:00 migration/0 
8? 00:00:00 rcu bh 
952 00:00:00 rcuob/0 
995 ? 00:00:00 sedispatch 
1001 ? 00:00:04 rtkit-daemon 
38136 ? 00:00:00 sshd 
38140 pts/3 00:00:00 bash 
38816 ? 00:00:00 sshd 


42238 pts/0 00:00:00 bash 


-e 表示 显示 所 有 进程 ， 也 可 以 用 -A， 含 义 一 样 。 上 面 第 一 列 的 内 容 就 是 进程 的 ID， 即 PID. 
最 后 一 列 就 是 进程 的 名 字 ， 和 所 对 应 的 程序 名 字 相 同 ， 因 此 会 出 现 重 名 (比如 上 面 的 ssh 和 bash 
进程 ) ， 虽 然 重 名 了 ， 但 其 PID 是 不 同 的 ， 因 此 PID 可 以 用 来 标识 一 个 进程 。 

在 开发 中 ， 我 们 可 以 用 函数 getpid 来 获取 当前 进程 的 ID， 该 函数 声明 如 下 : 
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#include <unistd.h> 
pid_t getpid (void); 
【 例 5.2】 获 取 当 前 进程 的 ID 
(1) 新 建 一 个 test.cpp 文件 ， 输 入 代码 如 下 : 


#include <iostream> 
#include <unistd.h> 
using namespace std; 


int main(int argc, char *argv[]) 
t 
pid t pid = getpid(); 
cout ««"pid-"««pid «« endl; 
return 0; 


} 
(20. 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
pid-42518 


结果 打印 的 内 容 就 是 进程 test 的 ID， 多 次 运行 可 以 发 现 每 次 打印 的 值 是 不 同 的 。 


5.2.2 PID 文件 

在 Linux 系统 的 /var/run 目录 下 ， 一 般 会 看 到 很 多 *.pid 文件 ， 而 且 往往 新 安装 的 程序 在 运行 后 
也 会 在 /var/run 目录 下 产生 自己 的 PID 文件 。 它 的 内 容 是 什么 呢 ? 其 实 ，PID 文件 为 文本 文件 ， 内 
容 只 有 一 行 ， 记 录 了 该 进程 的 ID。 我 们 可 以 用 cat 命令 来 查看 PID 文件 的 内 容 。 比 如 可 以 用 cat 命 
令 查看 /var/run 目录 下 的 sshd.pid 文件 。 

[root@localhost ~]# cd /var/run 


[root@localhost run]# cat sshd.pid 
1712 


说 明 进 程 sshd 的 PID 是 1712。 可 以 用 ps 来 查看 一 下 进程 sshd 的 PID。 


[root@localhost run]# ps -elgrep ssh 

1712 7 00:00:02 sshd 

那么 这 些 PID 文件 有 什么 作用 呢 ? PID 文件 的 作用 是 防止 进程 启动 多 个 副本 。 只 有 获得 相应 
PID 文件 写 入 权限 的 进程 才能 正常 启动 ， 并 把 自身 的 PID 写 入 该 文件 中 。PID 文件 位 于 固定 路 径 
Cvar/run) ， 并 且 文 件 名 也 是 固定 的 (进程 名 字 为 .pid〉。 

通常 有 两 种 方法 配合 PID 文件 来 实现 进程 的 重复 启动 。 一 种 是 文件 加 锁 法 ， 另 一 种 是 PID 读 
写法 。 文件 加 锁 法 的 基本 思路 是 进程 运行 后 会 给 .pid 文件 加 一 个 文件 锁 ， 只 有 获得 该 锁 的 进程 才 有 
写 入 权限 (F_WRLCK) ， 以 后 其 他 试图 获得 该 锁 的 进程 会 自动 退出 。 给 文件 加 锁 的 函数 是 fentl， 
如 果 成 功 锁定 ， 进 程 则 继续 往 下 执行 ， 如 果 锁 定 不 成 功 ， 说 明 已 经 有 同样 的 进程 在 运行 了 ， 进 程 就 
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退出 。 我 们 在 第 4 章 对 fend ROEIT TAR, SEMPR T. PID 读 





法 就 是 先 启 动 的 进 


程 往 PID 文件 中 写 入 自己 的 进程 ID 号 ， 然 后 其 他 进程 判断 该 PID 文件 中 是 否 有 数据 了 ， 下 面 看 一 


个 小 例子 。 
【 例 5.3】 通 过 PID 文件 判断 进程 是 否 运行 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdlib.h> 
#include <stdio.h> 
#include <sys/types.h> 
#include <sys/stat.h> 
#include «fcntl.h» 
#include <unistd.h> 
#include <string.h> 
#include <signal.h> 


static char* starter pid file default = "/var/run/test.pid"; 


static bool check pid(char *pid file) 
t 

struct stat stb; 

FILE *pidfile; 


if (stat(pid file, &stb) == 0) 
t 
pidfile - fopen(pid file, "r"); 
if (pidfile) 
t 
char buf[64]; 
pid t pid = 0; 
memset(buf, 0, sizeof(buf)); 
if (fread(buf, 1, sizeof(buf), pidfile)) 
t 
buf[sizeof(buf) - 1] = 'N0'; 
pid = atoi (buf); 
) 
fclose(pidfile); 
if (pid && kill(pid, 0) == 0)// 检 查 进程 
{ /* such a process is running */ 
return 1; 
} 
} 


printf ("removing pidfile '%s', process not running", pid file); 


unlink(pid file); 
) 


return 0; 


int main() 


t 
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FILE *fd = fopen(starter pid file default, "w"); 


3E {fd} 
t 
fprintf (fd, "$uWMn", getpid()); 
fclose(fd); 
) 
if (check pid(starter pid file default)) 
t 
printf("test is already running ($s exists)", 
starter pid file default); 


) 
else 
printf("test is NOT running ($s NOT exists)", 
starter pid file default); 


unlink(starter pid file default); 


return 0; 

) 

代码 中 ，check_pid 是 一 个 自 定义 函数 , 用 来 检查 PID 文件 是 否 存在 ， 继 而 判断 进程 是 否 运行 ， 
因为 整个 程序 设计 的 思路 是 程序 刚刚 启动 的 时 候 ， 会 创建 一 个 varrun/testpid 文件 ， 并 把 本 进程 的 
进程 号 写 入 该 文件 中 。 在 check. pid 中 , 用 了 stat 函数 判断 文件 是 否 存在 , 为 了 保险 起 见 , 又 用 fopen 
打开 了 一 次 。 如 果 存 在 , 就 读 取 该 文件 中 的 进程 号 , 然后 通过 kill 函数 检查 一 下 该 进程 是 否 在 运行 。 
kill 函数 的 第 二 参数 表示 准备 发 送 的 信号 代码 ， 如 果 为 零 ， 则 没有 任何 信号 送出 ， 但 是 系统 会 执行 
错误 检查 ， 通 常会 利用 sig 值 为 零 来 检验 某 个 进程 是 否 仍 在 执行 。 

程序 结束 的 时 候 ， 也 就 是 进程 即将 退出 的 时 候 ， 我 们 会 删除 PID 文件 。 


(2) 上 传 到 Linux， 然 后 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
test is already running (/var/run/test.pid exists) 


5.3 ”进程 的 创建 


5.3.1 使 用 fork 创建 进程 


Linux 可 以 通过 执行 系统 调用 函数 fork 来 创建 新 进程 。 由 fork 创建 的 新 进程 被 称 为 子 进程 。 
该 函数 被 调用 一 次 ， 但 返回 两 次 。 两 次 返回 的 区 别 是 子 进程 的 返回 值 是 0， 而 父 进程 的 返回 值 是 子 
进程 的 PID。 子 进程 和 父 进程 继续 执行 fork 之 后 的 指令 。 父 进程 和 子 进 程 几乎 是 等 同 的 一 一 它们 
具有 相同 的 变量 值 (但 变量 内 存 并 不 共享 ) ， 打 开 的 文件 也 都 相同 ， 还 有 其 他 一 些 相同 属性 。 如 果 
父 进程 改变 了 变量 的 值 ， 子 进程 将 不 会 看 到 这 个 变化 。 实 际 上 , 子 进程 是 父 进程 的 一 个 复制 ， 但 它 
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们 并 不 共享 内 存 。 实 际 上 ，Linux 并 不 完全 复制 内 存 页， 而 是 采用 了 写 时 复制 (copy on write) 的 
技术 ， 这 些 内 存 区 域 由 父 、 子 进程 共享 ， 而 且 内 核 将 它们 的 许可 权限 改 为 只 读 ， 当 有 进程 试图 修改 
这 些 区 域 时 ， 内 核 就 为 相关 部 分 做 一 下 复制 。 系 统 调用 函数 fork 的 声明 如 下 : 


#include <unistd.h> 
pid t fork(); 


该 函数 将 创建 一 个 子 进程 。 如 果 成 功 , 在 父 进程 的 程序 中 将 返回 子 进程 的 线程 ID， 即 PID 值 ; 
在 子 进程 中 函数 则 返回 0。 如果 失败 ， 则 在 父 进程 程序 中 返回 -1， 并 且 可 以 通过 errno 得 到 错误 码 。 

一 个 进程 成 功 调用 fork. 函数 后 ， 系 统 先 给 新 的 进程 分 配 资源 ， 例 如 存储 数据 和 代码 的 空间 。 
然后 把 原来 的 进程 的 所 有 值 都 复制 到 新 的 进程 中 , 只 有 少数 值 与 原来 的 进程 的 值 不 同 。 相 当 于 克隆 
了 一 个 自己 。 下 面 我 们 来 看 一 个 小 例子 。 
【 例 5.4】 通 过 fork 来 创建 子 进程 

(1) 打开 UE， 输 入 代码 如 下 : 








#include <iostream> 
using namespace std; 


#include <unistd.h> 
#include <stdio.h> 
int main() 
t 
pid t fpid; 
int count = 0; 
fpid = fork(); 
if (fpid < 0) // 如 果 函 数 返回 负数 ， 则 出 错 了 
cout<<"failed to fork"; 
else if (fpid == 0) // 如 果 fork 返 回 9，， 则 下 面 进入 子 程序 
{ 
cout<<"I am the child process, my pid is "««getpid()««endl; 
counttt; 
) 
else // 如 果 fork 返 回 值 大 于 0， 则 依旧 在 父 进程 中 执行 
t 
cout««"I am the parent process, my pid is "««Xgetpid()««endl; 
cout << "fpid -" «« fpid << endl; 
counttt; 
} 
printf("result: d\n", count); 
return 0; 


J 
(2) 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 
I am the parent process, my pid is 32726 





多 进程 编程 第 5 党 





fpid =32727 

count=1 

I am the child process, my pid is 32727 

count-1 

我 们 可 以 看 到 父 进程 和 子 进程 的 PID 是 不 同 的 , 说明 是 两 个 不 同 的 进程 。 在 语句 fpid-fork 
之 前 ， 只 有 一 个 进程 〈 父 进程 ) 在 执行 这 段 代 码 ， 但 在 这 条 语句 之 后 ， 就 变 成 两 个 进程 在 执行 
了 ， 这 两 个 进程 几乎 完全 相同 ， 将 要 执行 的 下 一 条 语句 都 是 if(fpid<0)， 父 进程 和 子 进程 都 会 执 
行 这 条 语句 。 

为 什么 这 两 个 进程 的 fpid 不 同 呢 ? 这 与 fork 函数 的 特性 有 关 。fork 调用 的 一 个 奇妙 之 处 就 是 
它 仅 仅 被 调用 一 次 ， 却 能 够 返回 两 次 。 父 进程 fork 返回 的 是 子 进程 的 PID， 我 们 可 以 看 到 父 进程 
中 的 打印 “fpid =32727” 和 子 进程 中 的 打印 “my pid is 32727” 一 样 ， 都 是 32727。 另 外 ，count 
分 别 在 父 进程 和 子 进 程 中 执行 了 一 次 count++， 所 以 输出 都 是 count=1。 

有 些 读者 可 能 疑惑 为 什么 不 是 从 第 一 行 #include 处 开始 复制 代码 , 这 是 因为 fork 是 把 进程 当前 
的 情况 复制 一 份 ， 执行 fork 时 ， 进 程 已 经 执行 完了 语句 “int count=0;”，fork 只 复制 下 一 次 要 执行 
的 代码 到 新 的 进程 。 

再 次 强调 ， 在 fork 函数 执行 完毕 后 ， 如 果 新 进程 创建 成 功 ， 则 出 现 两 个 进程 ， 一 个 是 子 进程 ， 
一 个 是 父 进程 。 在 子 进程 中 ，fork 函数 返回 0， 在 父 进程 中 ，fork 返回 新 创建 子 进程 的 进程 D。 我 
们 可 以 通过 fork 返回 的 值 来 判断 当前 进程 是 子 进程 还 是 父 进程 。 创 建新 进程 成 功 后， 系统 中 出 现 
两 个 基本 相同 的 进程 , 这 两 个 进程 没有 固定 的 先后 执行 顺序 , 哪个 进程 先 执行 要 看 操作 系统 的 进程 
调度 策略 o 


5.3.2 ”使 用 exec 创建 进程 


exec 用 被 执行 的 程序 (新 的 程序 替换 调用 它 〈 调 用 exec) 的 程序 。 相 对 于 fork 函数 会 创建 
一 个 新 的 进程 ， 产 生 一 个 新 的 PID，exec 会 启动 一 个 新 的 程序 替换 当前 的 进程 ， 且 PID 不 变 。 友 
情 提 醒 ， 胆 小 的 朋友 可 略 过 下 面 的 内 容 。 当 我 们 看 恐怖 片 时 ， 经 常会 有 这 样 的 场景 : 当 一 个 人 被 鬼 
上 身后 , 这 个 人 的 身体 表面 上 还 和 以 前 一 样 , 但 是 他 的 灵魂 和 思想 已 经 被 这 个 鬼 占 有 了 ， 因 此 会 控 
制 这 个 人 做 它 想 做 的 事情 ，exec 创建 的 进程 就 如 同 这 样 ， 新 创建 的 进程 已 经 占据 了 原来 的 进程 ， 
而 表面 PD) 上 看 起 来 依旧 不 变 。 那 么 是 如 何 实现 的 呢 ? 现在 我 们 来 学 习 exec() 函 数 族 。 





#include <unistd.h> 

int execl(const char *path, const char *arg, ...); 

int execlp(const char *file, const char *arg, ...); 

int execle(const char *path, const char *arg,..., char * const envp[]); 
int execv (const char *path, char *const argv[])7 

int execvp(const char *file, char *const argv[]l); 

int execvpe(const char *file, char *const argv[], char *const envp[l); 


一 共有 6 个 函数 ， 我 们 来 看 一 下 常用 的 几 个 。 
1. execl 函数 
函数 execl 函数 声明 如 下 : 
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#include <unistd.h> 
int execl (const char *path, const char *arg, ...); 


其 中 ， 参 数 path 指向 要 执行 的 文件 路 径 〈 可 以 是 命令 的 全 路 径 、 执 行程 序 的 全 路 径 或 脚本 文 
件 的 全 路 径 ) ;后面 的 参数 Carg 及 其 后 面 的 省 略 号 ) 代表 执行 该 程序 时 传递 的 参数 列表 ， 并 且 第 
一 个 被 认为 是 argv[0] CHI path 后 面 的 参数 被 认为 是 argv[0]) ， 第 二 个 被 认为 是 argv[1]…… 相 当 于 
main 函数 中 的 argv， 我 们 知道 main 中 的 argv[0] 是 程序 的 名 称 ， 程 序 所 需 的 参数 是 从 argv[1] 才 开 
始 获取 的 ，execl 的 argv[0] 也 是 按照 此 习惯 来 的 ， 即 argv[1] 才 是 传 给 execl 要 启动 的 程序 的 第 一 个 
参数 ，argv[0] 可 以 只 写 个 程序 名 (其 实 对 于 大 多 数 命 令 程 序 来 说 没什么 作用 ， 随 便 写 一 个 字符 串 也 
可 以 ， 大 家 可 以 从 后 面 的 例子 看 到 ， 但 不 要 写 NULL， 写 NULL 就 认为 参数 列表 就 此 结束 了 。 而 
对 于 自 定 义 程序 ， 则 要 视 实 际 情况 而 定 ， 有 些 自 定义 程序 需要 argv[0]， 此 时 就 不 能 乱 输 了 ， 大 家 
要 记 住 紧 跟 path 后 面 的 参数 相当 于 main 的 argv[0]) ， 最 后 一 个 参数 必须 用 空 指针 NULL 结束 。 
函数 成 功 时 不 返回 值 ， 失 败 则 返回 -1， 失 败 原 因 存 于 errno 中 ， 可 通过 perror0 打 印 。 

另外 要 注意 的 是 ， 对 于 系统 命令 程序 ， 比 如 pwd 命令 ，argv[0] 是 必须 要 有 的 ， 但 其 值 可 以 是 
一 个 无 意义 的 字符 串 。 


【 例 5.5】 使 用 execl 执行 不 带 选项 的 命令 程序 pwd 
(1) 打开 UE， 输 入 代码 如 下 : 


// 执 行 /bin/pwd 
#include <unistd.h> 


int main() 

{ 
// 执 行 /bin 目 录 下 的 pwd， 注 意 argv[0] 必 须要 有 
execl("/bin/pwd", "asdfaf", NULL); 
return 0; 


} 
(2) 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

/zww/test 

程序 运行 后 ， 打 印 了 当前 路 径 ， 这 和 执行 pwd 命令 是 一 样 的。 虽然 pwd 命令 不 带 选 项 ， 但 用 
execl 执行 的 时 候 ， 依 然 要 有 argv[0] 这 个 参数 。 大 家 可 以 试 试 把 “asdfaf” 去 掉 ， 那 样 就 会 报错 。 不 
过 这 样 乱 写 似乎 不 好 看 ， 一 般 都 是 写 命令 的 名 称 ， 比 如 execl("/bin/pwd", "pwd", NULL) 。 
【 例 5.6】 使 用 execl 执行 带 选项 的 命令 程序 1s 

(1) 打开 UE， 输 入 代码 如 下 : 

/* 

* execl 函 数 使 用 实例 1 


* 功 能 :执行 /bin/1s -al /etc/passwd 
57) 
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#include <unistd.h> 


int main() 
{ 
/x* 执 行 /bin 目 录 下 的 1s， ;EX€, argv [0] 传 入 的 是 程序 名 1s，argv[1]1 才 传 入 -al，argv[21 
传 入 的 是 要 查看 的 文件 /etc/passwd */ 
execl("/bin/ls", "ls","-al","/etc/passwd",NULL); 
return 0; 


l 
(20. 保存 文件 为 testcpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[rootelocalhost test]# g++ test.cpp -o test 
[rootQlocalhost test]# ./test 
-rw-r--r--. 1 root root 2727 12Ħ 16 2016 /etc/passwd 


passwd 是 etc 下 的 一 个 文件 。 我 们 可 以 在 shell 下 直接 用 1s 命令 进行 查看 。 


[root@localhost test]# ls -la /etc/passwd 

-rw-r--r--. 1 root root 2727 12 月 16 2016 /etc/passwd 

可 以 发 现 命令 行 运行 和 程序 运行 结果 是 一 样 的。 这 个 程序 中 ，execl 的 第 二 个 参数 (相当 于 
argv[0]) 其 实 没什么 用 处 ， 我 们 即使 随便 输入 一 个 字符 串 ， 效 果 也 是 一 样 的 ， 大 家 可 以 在 例子 中 修 
改 一 下 ， 比 如 : 


execl("/bin/ls", "lsadfadfae", "-al", "/etc/passwd", NULL); 


运行 结果 不 变 。 说 明 对 于 execl 函数 ， 只 要 提供 了 程序 的 全 路 径 和 argv[1] 开 始 的 参数 信息 ， 就 
Y 


可 以 
【 例 5.7】 使 用 execl 执行 我 们 的 程序 
(1) 首先 打开 UE， 编 写 一 个 小 程序 ， 代 码 如 下 : 


#include <string.h> 
using namespace std; 
#include <iostream> 


int main(int argc, char* argv[]) 
{ 
int i; 


cout ««"argc-" << argc << endl; // 打 印 一 下 传 进来 的 参数 个 数 


for(i=0;i<argc;i++) ”// 打 印 各 个 参数 
cout<<argv[i]<<endl; 


if (argc == 2&&strcmp(argv[1], "-p")==0) // 判 断 是 否 带 了 参数 -p 
cout << "will print all" << endl; 

else 
cout «« "will print little" «« endl; 
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cout << "my program over" << endl; 
return 0; 
} 


(2) 保存 文件 为 mytestcpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ mytest.cpp -o mytest 
[root@localhost test]# ./mytest 

argc=1 

./mytest 

will print little 

my program over 


(3) 小 程序 编写 完毕 ， 然 后 把 它 复 制 到 一 个 地 方 ， 比 如 /zww/test Fe FMH execl 来 执行 它 。 
继续 打开 UE， 输 入 代码 如 下 : 


#include <unistd.h> 
using namespace std; 
#include <iostream> 


int main(int argc, char* argv[]) 


t 
execl("/zww/test/mytest", NULL); // 不 传 任何 参数 给 mytest 
cout << "------------------ \n";V// 如 果 exec1 执 行 成 功 ， 这 一 句 不 会 执行 到 的 


return 0; 


} 
(4). 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[rootélocalhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

argc=0 

will print little 

my program over 


在 调用 execl 时 ， 没 有 传 任何 参数 给 mytest， 因 此 arge 打印 了 0， 这 说 明 执行 自己 的 程序 的 时 
候 ， 可 以 不 传 argv[0]， 这 一 点 和 执行 系统 命令 不 一 样 ， 大 家 可 以 和 前 面 的 例子 比较 一 下 。 下 面 传 2 
个 参数 给 mytest， 调 用 方式 改 为 如 下 : 





execl("/zww/test/mytest", "adsfadf","-p",NULL); 
保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

argc-2 

adsfadf 

m: 
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will print all 
my program over 


可 以 看 到 ， 我 们 给 mytest 传 了 两 个 参数 ， 分 别 是 “adsfadf” 和 “-p”。 大 家 还 可 以 试 试 传 一 个 
参数 给 mytest 的 情况 ， 比 如 : execl("/zww/test/mytest", "adsfadf' ,NULL);。 
下 面 再 看 一 下 函数 execlp， 其 声明 如 下 : 


int execlp(const char *file, const char *arg, ...); 


其 中 ,参数 file 指向 要 执行 的 程序 ， 但 不 需要 写 出 完整 路 径 ， 函 数 会 到 环境 变量 PATH 所 给 出 
的 路 径 中 去 查找 ， 找 到 后 便 执行 ， 后 面 的 参数 同 execl， 最 后 一 个 参数 也 必须 用 空 指针 NULL 作为 
结束 。 如 果 函 数 执行 成 功 ， 则 不 会 返回 ， 执 行 失败 则 直接 返回 -1， 错 误 码 存 于 ermo 中 。 


2. execlp 函数 


execlp 函数 会 从 PATH 环境 变量 所 指 的 目录 中 查找 符合 参数 file 的 文件 名 , 找到 后 便 执行 该 文 
件 ， 然 后 将 第 二 个 以 后 的 参数 当 作 该 文件 的 argv[0]、argv[1]……， 最 后 一 个 参数 必须 用 空 指针 
(NULLO 结束 。execlp 函数 声明 如 下 : 


#include <unistd.h> 
int execlp(const char *file, const char *arg, ...); 


如 果 执 行 成 功 ， 则 函数 不 会 返回 ， 执 行 失败 则 直接 返回 -1， 失 败 原因 存 于 erno 中 。 
【 例 5.8】 使 用 execlp 执行 不 带 选项 的 命令 程序 pwd 
(1) 首先 打开 UE， 编 写 一 个 小 程序 ， 代 码 如 下 : 


#include <unistd.h> 


int main(int argc, char* argv[]) 
t 
execlp("pwd", "", NULL); 
return 0; 


J 
(2) 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 
/zww/test 


execlp 的 第 一 个 参数 直接 用 pwd 这 个 命令 程序 即 可 ， 而 不 需要 写 出 其 全 路 径 ， 因 为 环境 变量 
PATH 中 已 经 包含 路 径 /usrbin 了 ， 而 /usrbin 下 有 pwd 这 个 程序 了 ， 大 家 可 以 用 echo 看 一 下 : 


/usr/lib64/qt-3.3/bin:/root/perl5/bin:/usr/local/sbin:/usr/local/bin:/usr/ 
Sbin:/usr/bin:/root/bin 

[rootélocalhost bin]£ cd /usr/bin 

[rootélocalhost bin]# ls pwd 

pwd 
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至 于 execlp 的 第 二 个 参数 为 什么 是 空 字符 串 ， 这 其 实 不 重要 ， 传 任意 字符 串 都 可 以 ， 但 必须 
要 有 ， 不 能 为 NULL， 和 否则 运行 会 报错 。 这 只 是 针对 创建 系统 命令 程序 的 情况 ， 我 们 自己 的 程序 无 


【 例 5.9】 使 用 execlp 执行 我 们 的 程序 
CD 首先 打开 UE， 编 写 一 个 小 程序 ， 代 码 如 下 : 


#include <string.h> 
using namespace std; 
#include «iostream» 


int main(int argc, char* argv[]) 
t 
int i; 


cout ««"argc-" << argc << endl; // 打 印 一 下 传 进来 的 参数 个 数 


for(i=0;i<argc;i++) ”// 打 印 各 个 参数 
cout««argv[i]««endl; 


) 
(2) 保存 文件 为 mytestcpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ mytest.cpp -o mytest 
[root@localhost test]# ./mytest hello world 
argc-3 

./mytest 

hello 

world 


(D 小 程序 编写 完毕 ， 然 后 把 它 复 制 到 /usrbin 下 。 下 面 用 execlp 来 执行 它 。 继 续 打 开 UE, 
输入 代码 如 下 : 


#include <unistd.h> 
using namespace std; 
#include <iostream> 


int main(int argc, char* argv[]) 
{ 
execl("mytest", NULL); // 不 传 任何 参数 给 mytest 
cout «« "------------------ \n"zV/ 如 果 exec1 执 行 成 功 ， 这 一 句 不 会 执行 到 


return 0; 


y 
(4) 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 


[root@localhost test]# ./test 
argc=0 





多 进程 编程 第 5 党 





我 们 的 mytest 执行 成 功 了 。 

其 实 ， 只 有 execvpe 是 真正 意义 上 的 系统 调用 ， 其 他 都 是 在 此 基础 上 经 过 包装 的 函数 。exec 
函数 族 的 作用 是 根据 指定 的 文件 名 找到 可 执行 文件 ,并 用 它 来 取代 调用 进程 的 内 容 ， 换 句 话说 ， 就 
是 在 调用 进程 (调用 exec 函数 族 的 进程 ) 内 部 执行 一 个 可 执行 文件 。 这 里 的 可 执行 文件 既 可 以 是 
二 进 制 文件 ， 也 可 以 是 任何 Linux 下 可 执行 的 脚本 文件 。 

细 看 一 下 ， 这 6 个 函数 都 是 以 exec 开头 (表示 属于 exec KAIR) 的 ， 前 3 个 函数 后 面 是 字母 
1， 表 示 list〈 列 举 参 数 ) 。 后 3 个 函数 接着 字母 v， 表 示 vector (参数 向 量 表 ) 。 它 们 的 区 别 在 于 ， 
execv 开头 的 函数 是 以 “char *argv[] ”(vector) 形 式 传递 命令 行 参 数 的 ， 而 execl 开头 的 函数 采用 罗 
列 〈list) 的 方式 ， 把 参数 一 个 一 个 列 出 来 ， 然 后 以 一 个 NULL 表示 结束 。 这 里 的 NULL 的 作用 和 
argv 数组 里 的 NULL 作用 是 一 样 的 。 


5.3.3 ”使 用 system 创建 进程 


system 函数 通过 调用 shell 程序 来 执行 所 传 入 的 命令 (效率 低 ) ， 相 当 于 先 fork), 再 execve()。 
该 函数 的 特点 是 源 进程 和 子 进 程 各 自 运行 ， 且 源 进 程 需要 等 子 进程 运行 完 后 再 继续 。system() 会 调 
用 fork0 产 生子 进程 ， 然 后 由 子 进程 来 调用 /bin/sh -c 执行 system 函数 的 参数 command 字符 串 所 代 
表 的 命令 ， 此 命令 执行 完 后 随即 返回 原 调用 的 进程 。/bin/sh 一 般 是 一 个 软 链接 ， 指 向 某 个 具体 的 
shell， 比 如 bash，-c 选项 是 告诉 shell 从 字符 串 command 中 读 取 命 令 。 在 该 command 执行 期 间 ， 
SIGCHLD 信号 会 被 暂时 搁置 , SIGINT 和 SIGQUIT 信号 则 会 被 忽略 (关于 信号 后 面 章 节 会 讲述 )。 
该 函数 声明 如 下 : 

#include <stdlib.h> 

int system(const char *command); 

其 中 ，command 是 要 执行 的 命令 。 如 果 fork 失败 ， 返 回 -1， 如 果 command 顺利 执行 完毕 ， 则 
返回 command 通过 exit 或 return 返回 的 值 。 

为 了 更 好 地 理解 system() 函 数 的 返回 值 ， 需 要 了 解 其 执行 过 程 ， 实 际 上 system() 函 数 执行 了 3 
步 操作 : 


CD fork 一 个 子 进 程 。 

(2) 在 子 进程 中 调用 exec 函数 去 执行 command. 

(3) 在 父 进程 中 调用 wait 等 待 子 进程 结束 。 如 果 fork 失败 ，system() 函 数 返 回 -1。 如 果 exec 
执行 成 功 , 即 command 顺利 执行 完毕 , 则 返回 command 通过 exit 或 return 返回 的 值 ( 注 意 ,command 
顺利 执行 不 代表 执行 成 功 ， 比 如 command: "rm debuglog.txt"， 无 论文 件 是 否 存在 ， 该 command 都 
顺利 执行 了 ) 。 如 果 exec 执行 失败 ， 即 command 没有 顺利 执行 ， 比 如 被 信号 中 断 或 者 command 
命令 根本 不 存在 ，system() 函 数 返 回 127。 如 果 command 为 NULL， 则 system() 函 数 返 回 非 0 值 ， 
一 般 为 1。 


看 完 这 3 点 ， 肯 定 有 人 对 system() 函 数 的 返回 值 还 是 不 清楚 ， 下 面 给 出 一 个 使 用 system() 函 数 
的 例子 。 

















int system(const char * cmdstring) 
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pid t pid; 
int status; 
if(cmdstring -- NULL) 
1 

return (1); // 如 果 cmdstring 为 空 ， 返 回 非 零 值 ， 一 般 为 1 
if((pid = fork())<0) 
t 

status = -1; //fork 失 败 ， 返 回 -1 
} 
else if (pid == 0) 
{ 

execl("/bin/sh", "sh", "-c", cmdstring, (char *x)0) ;// 子 进程 调用 exec1 执 

行 cmdstring 
_exit (127); // exec 执 行 失败 返回 127， 注 意 exec 只 在 失败 时 才 返 回 现在 的 进程 ， 成 功 
的 话 现在 的 进程 就 不 存在 

} 
else // 父 进程 
{ 

while(waitpid(pid, &status, 0) < 0) 

t 

if (errno != EINTR) 
{ 
status = -1; // 如 果 waitpid 被 信号 中 断 ， 则 返回 -1 


break; 


} 
} 
return status; // 如 果 waitpid 成 功 ， 则 返回 子 进 程 的 状态 
} 
仔细 看 完 这 个 system() 函 数 的 实现 ， 对 该 函数 的 返回 值 就 清楚 了 ， 比 如 什么 时 候 system() 函 数 
返回 0 呢 ? 只 在 command 命令 返回 0 时 。 


54 进程 调度 


进程 调度 也 就 是 处 理 机 调度 。 在 多 道 程序 设计 环境 中 ， 进 程 数 往往 多 于 处 理 机 数 ， 这 将 导致 
多 个 进程 对 处 理 机 资源 的 互相 争夺 。 进 程 调度 的 任务 是 控制 和 协调 进程 对 CPU 的 竞争 ， 按 照 一 定 
的 调度 算法 使 某 一 就 绪 进程 取得 CPU 的 控制 权 ， 从 而 转 为 运行 状态 。 进 程 调度 的 功能 主要 包括 : 
记录 系统 中 所 有 进程 的 执行 状况 ; 根据 一 定 的 调度 算法 , 从 就 绪 队 列 中 选 出 一 个 进程 来 准备 把 处 理 
机 分 配给 它 ; 将 处 理 机 分 配给 进程 ,进行 上 下 文 切换 , 把 选中 进程 的 进程 控制 块 内 有 关 的 现场 信息 
〈 如 程序 状态 字 、 通 用 寄存 器 等 内 容 ) 送 入 处 理 器 相应 的 寄存 器 中 ， 从 而 让 它 占 用 处 理 机 运行 。 
进程 的 调度 一 般 可 以 在 下 述 情况 下 发 生 : 
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CD 正在 执行 的 进程 运行 完毕 。 

(2) 正在 执行 的 进程 调用 阻塞 原 语 将 自己 阻塞 起 ， 并 来 进入 等 待 状态 。 

(3) 执行 中 的 进程 提出 VO 请 求 后 被 阻塞 。 

(D 正在 执行 的 进程 调用 了 P 原 语 操作 ， 因 资源 得 不 到 满足 而 被 阻塞 ; 或 者 调用 V 原 语 操作 
释放 了 资源 ， 从 而 激活 了 等 待 相应 资源 的 进程 队列 。 

(5) 在 分 时 系统 中 ， 时 间 片 已 经 用 完 。 

C6) 就 绪 队列 中 的 某 个 进程 的 优先 级 变 得 高 于 当前 运行 进程 的 优先 级 , 从 而 引起 进程 的 调度 。 


进程 调度 的 主要 问题 是 采用 某 种 算法 合理 有 效 地 将 处 理 机 分 配给 进程 ,其 调度 算法 应 尽 可 能 提 
高 资源 的 利用 率 ， 减 少 处 理 机 的 空闲 时 间 。 衡 量 进程 调度 的 算法 的 指标 有 : 面向 系统 的 吞吐 量 、 处 
理 机 利用 率 、 公 平 性 以 及 资源 分 配 的 平衡 性 等 , 面向 用 户 的 作业 周转 时 间 、 响 应 时 间 、 可 预测 性 等 。 
而 这 些 “ 合 理 的 目标 ”往往 是 相互 制约 的 ， 难 以 全 部 达到 要 求 。 实 际 系统 中 ,往往 综合 考虑 这 些 因 
素 ， 根据 具体 情况 区 别 对 待 或 者 进行 某 些 取 舍 。 常 见 的 进程 调度 算法 有 以 下 4 种。 


(1) 先 来 先 服务 法 (FCFS) 
将 进程 变 为 就 绪 状 态 的 先后 次 序 排 成 队列 ， 并 按照 先 来 先 服务 的 方式 进行 调度 处 理 ， 这 是 一 
种 最 普遍 也 是 最 简单 的 方法 。 


(2) 时 间 片 轮转 法 CRR) 

其 基本 思想 是 ， 将 CPU 的 处 理 时 间 划 分 成 一 个 个 时 间 片 ， 就 绪 队 列 中 的 各 个 进程 轮流 运行 一 
个 时 间 片 ， 当 时 间 片 结束 时 ， 就 强迫 运行 进程 让 出 CPU， 该 进程 进入 就 绪 队 列 等 待 下 一 次 调度 。 
而 同时 又 去 选择 就 绪 队 列 中 的 一 个 进程 ， 分 配给 它 一 个 时 间 片 ， 以 投入 运行 。 如 此 轮流 调度 ， 使 得 
就 绪 队 列 中 的 所 有 进程 在 有 限 的 时 间 内 都 可 以 依次 轮流 获得 一 个 时 间 片 的 处 理 机 时 间 。 这 主要 是 分 
时 系统 中 采用 的 一 种 调度 算法 。 


(3) 优先 级 算法 

进程 调度 每 次 将 处 理 机 分 配给 具有 最 高 优先 级 的 就 绪 进 程 。 进 程 优 先 级 的 设置 可 以 是 静态 的 ， 
也 可 以 是 动态 的 。 静态 优先 级 是 在 进程 创建 时 根据 进程 初始 状态 或 者 用 户 要 求 而 确定 , 在 进程 运行 
期 间 不 再 改变 。 动态 优先 级 则 是 指 在 进程 创建 时 先 确定 一 个 初始 优先 级 ,以 后 在 进程 运行 中 随 着 进 
程 的 不 断 推进 ， 其 优先 级 值 也 随 着 不 断 地 改变 。 


(4) 多 级 反馈 队列 法 

在 实际 系统 中 ， 调 度 模式 往往 是 几 种 调度 算法 的 结合 。 多 级 队列 反馈 法 就 是 综合 了 先 来 先 服 
务 法 、 时 间 片 轮转 法 和 优先 级 法 的 一 种 进程 调度 算法 。 系统 按照 优先 级 别 的 不 同 设置 若干 个 就 绪 队 
列 ， 对 级 别 较 高 的 队列 分 配 较 小 的 时 间 片 ， 对 级 别 较 低 的 队列 分 配 稍 大 一 点 的 时 间 片 。 除 了 最 低 一 
级 的 队列 采用 时 间 片 轮转 法 调度 之 外 , 其 他 各 级 队列 均 采 用 先 来 先 服务 法 调度 。 系 统 总 是 先 调度 级 
别 较 高 队列 中 的 进程 , 仅 当 该 队列 为 空 时 才 去 调度 下 一 级 队列 中 的 进程 。 当 执行 进程 用 完 其 时 间 片 
时 ， 便 被 剥夺 并 进入 下 一 级 就 绪 队列 。 当 等 待 进程 被 唤醒 时 ， 它 进入 与 其 优先 级 对 应 的 就 绪 队 列 ， 
若 其 优先 级 高 于 当前 执行 进程 ， 便 抢占 CPU 执行 。 

Linux 采用 的 是 基于 优先 级 可 抢占 式 的 调度 系统 ,并 使 用 schedule 函数 来 实现 进程 调度 的 功能 。 
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Linux 所 实现 的 可 抢占 还 只 是 一 定 程度 上 的 抢占 ， 因 为 到 目前 为 止 ，Linux 内 核 还 不 是 抢占 式 的 ， 
因此 这 意味 着 进程 只 有 在 用 户 态 运行 时 才能 被 抢占 。 如 果 一 个 进程 变 为 TASK _ RUNNING 状态 ， 
内 核 则 会 检查 它 的 动态 优先 级 是 否 大 于 当前 正在 CPU 上 运行 的 进程 优先 级 。 如 果 是 ， 当 前 执行 进 
程 将 被 中 断 ， 并 使 用 调度 程序 选择 另 一 个 进程 运行 〈 通 常 是 刚刚 变 为 可 运行 状态 的 进程 ) 。 此 外 ， 
进程 在 它 的 时 间 片 到 期 时 也 可 以 被 抢占 。 

1. 优先 级 

为 了 选择 一 个 进程 运行 ，Linux 调度 程序 必须 考虑 每 个 进程 的 优先 级 。 实 际 上 ，Linux 采用 了 
两 种 优先 级 : 静态 优先 级 和 动态 优先 级 。 静 态 优先 级 只 针对 实时 进程 ， 它 由 用 户 赋 给 实时 进程 ， 范 
围 为 1~99， 以 后 调度 程序 不 再 改变 它 。 动 态 优先 级 只 应 用 于 普通 进程 ， 实 质 上 它 是 基本 时 间 片 与 
当前 时 期 内 的 剩余 时 间 片 之 和 。 其 实 ， 实 时 进程 的 静态 优先 级 总 是 高 于 普通 进程 的 动态 优先 级 ， 因 
此 只 有 在 处 于 可 运行 状态 的 进程 中 且 没 有 实时 进程 后 ， 调 度 程序 才 开始 运行 普通 进程 。 

2. 调度 策略 

Linux 对 实时 进程 和 普通 进程 区 别 对 待 。 对 于 实时 进程 有 两 种 调度 策略 : SCHED FIFO 和 
SCHED RR. SCHED FIFO 就 是 先进 先 出 的 算法 ， 当 调度 程序 将 CPU 分 配给 一 个 进程 时 ， 该 进程 
的 task. struct 结构 还 保留 在 运行 队列 链表 的 当前 位 置 。 如 果 没 有 其 他 更 高 优先 级 的 实时 进程 ， 这 个 
进程 就 可 以 占用 CPU 直至 运行 完毕 。SCHED_RR 就 是 采用 循环 轮转 的 方法 ， 当 调度 程序 将 CPU 
分 配给 一 个 进程 时 ， 则 将 这 个 进程 的 tasl_struct 放置 在 运行 队列 的 末尾 。 这 种 策略 确保 了 把 CPU 
时 间 公 平地 分 配给 具有 相同 优先 级 的 实时 进程 。 对 于 普通 的 分 时 进程 采用 SCHED_OTHER 策略 。 

Linux 的 进程 调度 由 内 核 函数 schedule 实现 。Linux 在 进程 终止 、 进 程 睡眠 或 者 某 个 进程 变 为 
可 运行 状态 时 都 可 能 会 发 生 进程 调度 ; 如 果 当 前 进程 的 时 间 片 用 完 ， 或 者 进程 从 中 断 、 异 常 及 系统 
调用 返回 到 用 户 态 时 ， 都 可 能 会 发 生 进 程 调度 。Linux 进程 的 状态 转换 如 图 5-1 所 示 。 

fork 








可 运行 状态 ; 


收 到 信号 先 于 父 进程 终止 


*314* 
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COD 可 运行 状态 (TASK_RUNNING) 

处 于 这 种 状态 的 进程 ,要么 正在 CPU 上 运行 ， 要 么 准备 运行 。 正 在 CPU 上 运行 的 进程 就 是 当 
前 进程 (由 current 宏 表示 ) ， 而 准备 运行 的 进程 只 要 得 到 CPU 就 可 以 立即 投入 运行 ，CPU 是 这 些 
进程 唯一 等 待 的 系统 资源 。 系 统 中 有 一 个 运行 队列 ,用 来 容纳 所 有 处 于 可 运行 状态 的 进程 ， 调 度 程 
序 执 行 时 ， 从 中 选择 一 个 进程 投入 运行 。 

(2) 可 中 断 的 等 待 状态 (TASK_INTERRUPTIBLE) 

进程 被 挂 起 ， 直 到 一 些 条 件 满足 为 止 ， 条 件 可 能 包括 : 产生 一 个 硬件 中 断 、 释 放 进 程 正 等 待 
的 系统 资源 或 者 传递 一 个 信号 , 这 些 都 有 可 能 唤醒 进程 ， 让 进程 的 状态 返回 到 TASK_RUNING 





COD 不 可 中 断 的 等 待 状态 (TASK_UNINTERRUPTIBLE) 

这 种 状态 与 前 一 种 状态 相似 ， 但 不 同 的 是 ， 传 递 信号 给 睡眠 的 进程 并 不 能 改变 其 状态 。 这 种 
状态 不 太 常 见 ， 但 在 一 些 特定 的 情况 下 是 很 有 用 的 ， 例 如 进程 必须 等 待 ， 直 到 给 定 的 事件 发 生 ， 而 
其 间 不 能 被 中 断 。 


(4) 暂停 状态 (TASK_STOPPED) 

进程 的 执行 已 经 被 暂停 ， 当 进程 接收 到 SIGSTOP、SIGTSTP、SIGTTIN 或 者 SIGTTOU 信号 
后 , 进入 暂停 状态 。 当 一 个 进程 正在 被 男 一 个 进程 监控 时 (例如 调试 程序 执行 ptrace 系统 调用 来 监 
控 测试 程序 ) ， 每 一 个 这 样 的 信号 都 可 以 将 这 个 进程 置 于 TASK_STOPPED 状态 。 


(5) JERA CTASK_ZOMBIE) 

进程 的 执行 已 经 终止 ， 但 是 父 进程 还 没有 发 布 wait 类 系统 调用 来 返回 有 关 终 止 进程 的 信息 。 
在 父 进程 发 布 wait 类 系统 调用 之 前 ， 内 核 不 能 丢弃 包含 在 终止 进程 task_struct 结构 中 的 数据 ， 因 
为 父 进程 可 能 还 需要 这 些 信息 。 





5.5 ”进程 的 分 类 


Linux 下 ， 进 程 一 般 分 为 前 台 进 程 、 后 台 进 程 和 守护 进程 (Daemon) 3 类 。 
5.5.1 前 台 进 程 

前 台 进程 〈 也 称 普 通 进程 ) 就 是 需要 和 用 户 交 换 的 进程 。 默 认 情况 下 ， 启 动 一 个 进程 都 是 在 
前 台 运 行 的 ， 这 时 它 就 把 Shell 给 占据 了 ， 我 们 无 法 进行 其 他 操作 ， 一 直 等 到 该 进程 终止 。 前 面 讲 
述 的 进程 基本 都 是 前 台 进 程 。 查 看 普通 进程 的 命令 是 ps， 可 以 根据 需要 加 上 不 同 的 命令 选项 ， 比 
如 通过 进程 名 来 查找 进程 号 : 

ps -e | grep 进程 名 
5.5.2 后台 进程 

对 于 那些 不 需要 交互 的 进程 , 很 多 时 候 希 望 将 其 在 后 台 启 动 , 可 以 在 启动 的 时 候 加 一 个 “&”。 
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比如 一 个 进程 的 名 字 叫 recv， 我 们 希望 它 在 后 台 运 行 ， 则 可 以 输入 : recv &。 这 样 它 就 是 一 个 后 台 
进程 了 ， 而 且 不 会 占据 Shell， 我 们 依然 可 以 在 Shell 下 做 其 他 操作 。 但 关闭 Shell 窗口 的 时 候 ， 后 
台 进 程 也 将 随 之 退出 。 我 们 把 切换 到 后 台 运 行 的 进程 称 为 job。 当 一 个 进程 以 后 台 方 式 启动 时 〈 即 
启动 时 加 上 &) , 系统 会 输出 该 进程 的 相关 job 信息 , 会 输出 job ID 和 进程 ID。 在 后 台 运行 的 进程 ， 
可 以 用 ps 命令 查看 ， 或 通过 jobs 命令 只 查看 所 有 job 〈 后 台 进 程 ) 。 如 果 想 要 终止 某 个 后 台 进 程 ， 
可 使 用 命令 killall， 比 如 终止 所 有 名 为 recv 的 后 台 进程 : Killall recv。 不 过 这 种 方法 有 点 简单 粗暴 。 


【 例 5.10】 制 作 一 个 后 台 进 程 并 查看 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 





#include <unistd.h> 
#include <iostream> 
using namespace std; 


int main(void) 
ii 
cout «« "hello,world" «« endl; 
sleep(10000); 
cout << "byebye"««endl; 
) 
(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 : g++ -o test test.cpp， 然 后 运行 test， 运 行 结 
果 如 下 : 
[root@localhost test]# g++ -o test test.cpp 
[root@localhost test]# ./test & 
[1] 62096 
[root@localhost test]# hello,world 
其 中 ，[1] 表 示 job 的 ID，62096 表示 进程 test 的 进程 ID。 现 在 进程 test 以 后 台 方 式 运 行 了 ， 
马上 可 以 通过 命令 jobs 来 查看 : 
[root@localhost test]# jobs 
[1]+ 运行 中 ./test & 


显示 一 个 后 台 进 程 test 正在 运行 中 。 
5.6 ”守护 进程 


5.6.1 守护 进程 的 概念 


守护 进程 (Daemon Process) 是 运行 在 后 台 的 一 种 特殊 进程 。 它 独立 于 控制 终端 并 且 周 期 性 地 
执行 某 种 任务 或 等 待 处 理 某 些 发 生 的 事件 。 守 护 进程 是 一 种 很 有 用 的 进程 。Linux 中 大 多 数 服务 器 
都 是 用 守护 进程 实现 的 ， 比 如 Intemet 服务 器 inetd, Web 服务 器 httpd 等 ， 另 外 还 有 常见 的 守护 进 
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程 包括 系统 日 志 进程 syslogd、 数 据 库 服务 器 mysqld 等 。 同 时 ， 守 护 进程 完成 许多 系统 任务 ， 比 如 
作业 规划 进程 crond、 打 印 进程 lpd 等 。 

守护 进程 脱离 终端 运行 ， 之 所 以 脱离 于 终端 ， 是 为 了 避免 进程 被 任何 终端 所 产生 的 信息 所 打 
断 ， 其 在 执行 过 程 中 的 信息 也 不 在 任何 终端 上 显示 。Linux 中 , 每 一 个 系统 与 用 户 进行 交互 的 界面 
称 为 终端 , 每 一 个 从 此 终端 开始 运行 的 进程 都 会 依附 于 这 个 终端 , 这 个 终端 就 称 为 这 些 进程 的 控制 
终端 ， 当 控制 终端 被 关闭 时 ， 相 应 的 进程 都 会 自动 关闭 ， 因 此 守护 进程 要 脱离 终端 运行 ,默默 地 在 
后 台 提 供 服 务 。 

守护 进程 一 般 在 系统 启动 时 开始 运行 ， 除 非 强行 终止 ， 否 则 直到 系统 关机 都 保持 运行 。 守 护 
进程 经 常 以 超级 用 户 (root) 权限 运行 ， 因 为 它们 要 使 用 特殊 的 端口 (1~1024) 或 访问 某 些 特殊 的 

一 个 守护 进程 的 父 进程 是 init 进程 , 因为 它 真 正 的 父 进程 在 创建 出 子 进程 后 就 先 于 子 进程 退出 
了 ， 所 以 它 是 一 个 由 init 继承 的 孤儿 进程 。 守 护 进 程 是 非 交 互 式 程序 ， 没有 控制 终端 ， 所 以 任何 输 
出 ,无 论 是 向 标准 输出 设备 stdout 还 是 标准 出 错 设备 stderr 的 输出 都 需要 特殊 处 理 。 守 护 进程 的 名 
称 通 常 以 d 结尾 ， 比 如 sshd、xinetd、crond 等 。 

守护 进程 类 似 于 Windows 操作 系统 中 的 服务 程序 。 它 通常 以 超级 用 户 启动 , 并 且 没 有 控制 
SM 
5.6.2 ”守护 进程 的 特点 

守护 进程 最 重要 的 特点 是 后 台 运 行 。 其 次 ， 守 护 进 程 必须 与 其 运行 前 的 环境 隔离 开 来 。 这 些 
环境 包括 未 关闭 的 文件 描述 符 、 控 制 终端 会话 和 进程 组 、 工 作 目 录 以 及 文件 创建 掩 模 等 。 这 些 环 
境 通常 是 守护 进程 从 执行 它 的 父 进 程 〈 特 别 是 shell) 中 继承 下 来 的 。 最 后 ， 守 护 进 程 的 启动 方式 
有 其 特殊 之 处 。 它 可 以 在 Linux 系统 启动 时 从 启动 脚本 /etc/re.d 中 启动 ,可 以 由 作业 规划 进程 crond 
启动 ， 还 可 以 由 用 户 终 端 (通常 是 shell) 执行 。 

总 之 ， 除 了 这 些 特 殊 性 以 外 ， 守 护 进程 与 普通 进程 基本 上 没有 什么 区 别 。 因 此 ， 编 写 守 护 进 
程 实际 上 是 把 一 个 普通 进程 按照 上 述 守 护 进程 的 特性 改造 成 守护 进程 。 如 果 对 进程 有 比较 深入 的 认 
识 ， 就 更 容易 理解 和 编程 了 。 

守护 进程 有 下 面 几 个 特点 : 


(1) 守护 进程 都 具有 超级 用 户 的 权限 。 

(20 守护 进程 的 父 进程 是 init 进程 。 

(3) 守护 进程 都 不 用 控制 终端 ， 其 TTY 列 以 “? ”表示 ，TPGID 为 -1。 

(4) 守护 进程 都 是 各 自 进程 组 合 会 话 过 程 的 唯一 进程 。 

除了 这 几 个 特点 之 外 ， 守 护 进 程 和 普通 进程 基本 没 区 别 ， 但 守护 进程 应 该 编写 得 更 可 靠 、 更 健 
壮 ， 这 一 点 要 注意 。 编 写 守护 进程 可 以 先 写 一 个 普通 进程 ， 然 后 按照 一 定 的 规则 改造 成 守护 进程 。 


5.6.3 ”查看 守护 进程 


可 以 使 用 命令 ps x 或 ps axj 来 查看 当前 运行 着 的 守护 进程 。 其 中 ,a 表示 不 仅 列 出 当前 用 户 的 
进程 ， 也 列 出 所 有 其 他 用 户 的 进程 ;x 表示 不 仅 列 有 控制 终端 的 进程 ， 也 列 出 所 有 无 控制 终端 的 进 


Y 
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程 ; j 表示 列 出 与 作业 控制 相关 的 信息 。 


比如 我 们 在 终端 下 输入 ps axj: 
[root@localhost ~]# ps axj 
PEID PID PGID SID TIY TPGID STAT UID TIME COMMAND 
0 2i 0 0o ? cab s 0 0:00 [kthreadd] 
2 3 0 ONE cab ql 0 0:04 [ksoftirqd/0] 
2 7 0 0 m) -1 S 0 0:00 [migration/0] 
2 8 0 OE EINE! 0 0:00 [rcu bh] 


从 上 面 的 结果 可 以 看 出 守护 进程 的 特点 ，TTY 表示 控制 终端 ， 可 以 看 到 这 几 个 守护 进程 的 控 
制 终端 为 “? ”, 意思 是 这 几 个 守护 进程 没有 控制 终端 。UID 为 0， 表 示 进 程 的 启动 者 是 超级 进程 。 


5.6.4 ”守护 进程 的 分 类 


根据 守护 进程 的 启动 和 管理 方式 ， 可 以 将 守护 进程 分 为 独立 启动 守护 进程 和 超级 守护 进程 两 类 。 

独立 启动 (stand_alone) 守护 进程 : 该 类 守护 进程 随 系统 启动 ， 启 动 后 就 常 驻 内 存 ， 所 以 会 一 
直 占 用 系统 资源 。 其 最 大 的 优点 是 它 会 一 直 启 动 ， 当 外 界 有 要 求 时 响应 速度 较 快 ， 比 如 httpd 等 进 
程 。 此 类 守护 进程 通常 保存 在 /etc/re.d/init.d 目录 下 。 

超级 守护 进程 : 系统 启动 时 ， 由 一 个 统一 的 守护 进程 xinet 来 负责 管理 一 些 进程 ， 当 响应 请 求 
到 来 时 ， 需 要 通过 xinet 的 转 接 才 可 以 唤醒 被 xinet 管理 的 进程 。 这 种 进程 的 优点 是 , 最 初 只 有 xinet 
这 一 守护 进程 占有 系统 资源 , 其 他 的 内 部 服务 并 不 一 直 占 有 系统 资源 , 只 有 数据 包 或 其 他 请 求 到 来 
时 才 会 被 xinet 唤醒 。 并 且 还 可 以 通过 xinet 对 它 所 管理 的 进程 设置 一 些 访问 权限 , 相当 于 多 了 一 层 
管理 机 制 。 

我 们 可 以 用 银行 业务 来 形容 这 两 类 守护 进程 。 

独立 启动 守护 进程 : 银行 里 有 一 种 单 服务 的 窗口 ， 像 取 钱 、 存 钱 等 窗口 ， 这 种 窗口 边 上 始终 
会 坐 着 一 个 人 ， 如 果 有 人 来 取 钱 或 存 钱 ， 可 以 直接 到 相应 的 窗口 去 办 理 ， 这 个 处 理 单一 服务 的 始终 
存在 的 人 就 是 独立 启动 的 守护 进程 。 

超级 守护 进程 : 银行 里 还 有 一 种 窗口 ， 提 供 综合 服务 ， 像 汇款 、 转 账 、 提 款 等 业务 ， 这 种 窗 
口 附近 也 始终 坐 着 一 个 人 (xinet)， 他 可 能 不 提供 具体 的 服务 ,提供 具体 服务 的 人 在 里 面 闲 着 聊天 、 
喝 茶 ， 但 是 当 有 人 来 汇款 时 ， 他 会 通知 里 面 的 人 ， 比 如 有 人 来 汇款 了 ， 他 会 通知 里 面 管 汇款 的 工作 
人 员 ， 然 后 里 面 管 汇款 的 工作 人 员 会 立马 跑 过 来 帮忙 办 完 汇 款 业 务 。 其 他 的 人 继续 聊天 、 喝 茶 。 这 
些 负责 具体 业务 的 人 就 称 为 超级 守护 进程 。 当然 , 可 能 汇款 时 会 有 一 些 规则 , 比如 不 能 往 北京 汇款 ， 
管 汇款 的 工作 人 员 就 会 提早 告诉 外 面 的 管理 员 , 当 有 人 想 往 北京 汇款 时 , 管理 员 就 直接 告诉 他 不 能 
办 理 ， 于 是 根本 不 会 去 喊 汇款 员 ， 相 当 于 提供 了 一 层 管理 机 制 。 这 里 需要 注意 的 是 ,超级 守护 进程 
的 管理 员 xinet 也 是 一 个 守护 进程 ， 只 不 过 它 的 任务 就 是 传 话 ， 其 实 这 也 是 一 个 很 具体 很 艰巨 的 任 
务 。 

当然 ， 每 个 守护 进程 都 会 监听 一 个 端口 〈 银 行 窗 口 ) ， 一 些 常 用 守护 进程 的 监听 端口 是 固定 
的 ， 像 httpd 监听 80 端口 、sshd 监听 22 端口 等 ， 我 们 可 以 将 其 理解 为 责任 制 ， 时 刻 等 待 ， 有 求 必 
应 。 具 体 的 端口 信息 可 以 通过 cat /etc/services 来 查看 。 

每 个 守护 进程 都 会 有 一 个 脚本 ， 可 以 理解 成 工作 配置 文件 ， 守 护 进程 的 脚本 需要 放 在 指定 位 
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置 ,独立 启动 守护 进程 的 脚本 放 在 /etc/init.d/ 目 录 下 ， 当 然 也 包括 xinet 的 shell 脚本 ; 超级 守护 进程 
按照 xinet 中 脚本 的 指示 ， 所 管理 的 守护 进程 位 于 /etc/xinetd.config 目录 下 。 


5.6.5 ”守护 进程 的 启动 方式 
守护 进程 一 般 是 随 着 系统 启动 而 自动 激活 的 。 它 可 以 通过 以 下 方式 启动 : 


CD. 在 系统 启动 时 由 启动 脚本 启动 ， 这 些 启动 脚本 通常 放 在 /etc/re.d 目录 下 。 
(2) 利用 inetd 超级 服务 器 启动 ， 如 telnet 等 。 
(3) 由 cron 定时 启动 ， 在 终端 用 nohup 启动 的 进程 也 是 守护 进程 。 


5.6.6 ”编写 守护 进程 的 步骤 


在 Linux 或 者 UNIX 操作 系统 中 , 在 系统 引导 的 时 候 会 开启 很 多 服务 ,这些 服务 就 叫 作 守护 进 
程 。 为 了 增加 灵活 性 ，root 可 以 选择 系统 开启 的 模式 ， 这 些 模 式 叫 作 运行 级 别 ， 每 一 种 运行 级 别 以 
一 定 的 方式 配置 系统 。 守 护 进 程 是 脱离 于 终端 并 且 在 后 台 运行 的 进程 。 守 护 进程 脱离 于 终端 是 为 了 
避免 进程 在 执行 过 程 中 的 信息 在 任何 终端 上 显示 , 并 且 进 程 也 不 会 被 任何 终端 所 产生 的 终端 信息 所 
打 断 。 

在 具体 编写 守护 进程 之 前 ， 我 们 先 来 了 解 一 下 守护 进程 编程 的 基本 步骤 。 


(1) 创建 子 进程 ， 父 进程 退出 

这 是 编写 守护 进程 的 第 一 步 。 由 于 守护 进程 是 脱离 控制 终端 的 , 因此 完成 第 一 步 后 就 会 在 Shell 
终端 里 造成 程序 已 经 运行 完毕 的 假象 。 之 后 的 所 有 工作 都 在 子 进程 中 完成 ， 而 用 户 在 Shell 终端 里 
则 可 以 执行 其 他 命令 ， 从 而 在 形式 上 做 到 与 控制 终端 的 脱离 。 

在 Linux 中 , 父 进 程 先 于 子 进程 退出 会 造成 子 进程 成 为 孤儿 进程 , 而 每 当 系统 发 现 一 个 孤儿 进 
程 时 ， 就 会 自动 由 1 号 进程 Gid 收养 它 ， 这 样 原先 的 子 进程 就 会 变 成 init 进程 的 子 进程 。 


(2) 在 子 进程 中 创建 新 对 话 

这 个 步骤 是 创建 守护 进程 中 最 重要 的 一 步 ， 虽 然 它 的 实现 非常 简单 ， 但 意义 却 非常 重大 。 在 
这 里 使 用 的 是 系统 函数 setsid， 在 具体 介绍 setsid 之 前 ， 首 先 要 了 解 两 个 概念 : 进程 组 和 会 话 周期 。 

进程 组 : 是 一 个 或 多 个 进程 的 集合 。 进 程 组 由 进程 组 ID 来 唯一 标识 。 除 了 进程 号 PID) 之 
外 ， 进 程 组 ID 也 是 一 个 进程 的 必 备 属性 。 每 个 进程 组 都 有 一 个 组 长 进程 ， 其 组 长 进程 的 进程 号 等 
于 进程 组 ID， 且 该 进程 组 ID 不 会 因 组 长 进程 的 退出 而 受到 影响 。 

会 话 周期 : 会 话 周期 是 一 个 或 多 个 进程 组 的 集合 。 通 常 ， 一 个 会 话 开 始 于 用 户 登录 ， 终 止 于 
用 户 退 出 ， 在 此 期 间 ， 该 用 户 运 行 的 所 有 进程 都 属于 这 个 会 话 周期 。 

接 下 来 具体 介绍 setsid 的 相关 内 容 。 

setsid 函数 用 于 创建 一 个 新 的 会 话 ， 并 担任 该 会 话 组 的 组 长 。 调 用 setsid 有 下 面 3 个 作用 。 





@ 让 进程 摆脱 原 会 话 的 控制 。 
© 让 进程 摆脱 原 进程 组 的 控制 。 
@ ”让 进程 摆脱 原 控制 终端 的 控制 。 
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那么 ,在 创建 守护 进程 时 为 什么 要 调用 setsid 函数 呢 ? 由 于 创建 守护 进程 的 第 一 步调 用 了 fork 
函数 来 创建 子 进程 ， 再 将 父 进 程 退出 。 在 调用 fork 函数 时 ， 子 进程 全 盘 复 制 了 父 进程 的 会 话 周期 、 
进程 组 、 控 制 终端 等 ， 虽 然 父 进程 退出 了 ,但 会 话 周期 、 进 程 组 、 控 制 终端 等 并 没有 改变 ， 因 此 还 
不 是 真正 意义 上 的 独立 开 来 ， 而 setsid 函数 能 够 使 进程 完全 独立 出 来 ， 从 而 摆脱 其 他 进程 的 控制 。 


(3) 改变 当前 目录 为 根 目 录 

这 一 步 也 是 必要 的 步 又。 使 用 fork 创建 的 子 进程 继承 了 父 进程 当前 的 工作 目录 。 由 于 在 进程 
运行 中 ， 当 前 目录 所 在 的 文件 系统 (如 “/mntusb”) 是 不 能 卸载 的 ， 这 对 以 后 的 使 用 会 造成 诸多 
麻烦 。 因 此 ， 通 常 的 做 法 是 让 “/” 作 为 守护 进程 的 当前 工作 目录 ， 这 样 就 可 以 避免 上 述 的 问题 。 
当然 ， 如 果 有 特殊 需要 ， 也 可 以 把 当前 工作 目录 换 成 其 他 的 路 径 ， 如 /tmp。 改 变 工作 目录 的 常见 函 
数 是 chdir。 


(4). 重 设 文件 权限 掩 码 

文件 权限 掩 码 是 指 屏蔽 掉 文 件 权限 中 的 对 应 位 。 比 如 ， 有 个 文件 权限 掩 码 是 050， 它 就 屏蔽 了 
文件 组 拥有 者 的 可 读 与 可 执行 权限 。 由 于 使 用 fork 函数 新 建 的 子 进程 继承 了 父 进程 的 文件 权限 掩 
码 ， 这 就 给 该 子 进程 使 用 文件 带 来 了 诸多 麻烦 。 因 此 , 把 文件 权限 掩 码 设置 为 0 可 以 大 大 增强 该 守 
护 进 程 的 灵活 性 。 设 置 文件 权限 掩 码 的 函数 是 umask。 在 这 里 ， 通 常 的 使 用 方法 为 umask(0)。 


(5) 关闭 文件 描述 符 

同文 件 权限 掩 码 一 样 ， 用 fork 函数 新 建 的 子 进程 会 从 父 进程 那里 继承 一 些 已 经 打开 的 文件 。 
这 些 被 打开 的 文件 可 能 永远 不 会 被 守护 进程 读 写 , 但 它们 一 样 消耗 系统 资源 , 而 且 可 能 导致 所 在 的 
文件 系统 无 法 卸载 。 

由 于 守护 进程 是 脱离 控制 终端 的 ， 因 此 从 终端 输入 的 字符 不 可 能 到 达 守 护 进程 ， 守 护 进程 中 
用 常规 方法 (如 print) 输出 的 字符 也 不 可 能 在 终端 上 显示 出 来 。 所 以 , 文件 描述 符 为 0、1 和 2 的 
3 个 文件 〈 常 说 的 输入 、 输 出 和 报错 ) 已 经 失去 了 存在 的 价值 ， 也 应 被 关闭 。 通 常 按 如 下 方式 关闭 
文件 描述 符 : 


for (i=0;i<MAXFILE;i++) 
close(i); 

C6) 守护 进程 退出 处 理 

当 用 户 需要 外 部 停止 守护 进程 运行 时 ， 往 往 会 使 用 kill 命令 停止 该 守护 进程 。 所 以 ， 守 护 进 
程 中 需要 编码 来 实现 kill 发 出 的 signal 信号 处 理 ， 达 到 进程 的 正常 退出 。 

signal (SIGTERM, sigterm handler); 

void sigterm handler (int arg) 

{ 


running = 0; 


} 
这 样 ， 一 个 简单 的 守护 进程 就 建立 起 来 了 。 下 面 我 们 来 看 一 个 具体 实例 。 
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【 例 5.11] Bi 10 秒 在 {mp/dameon.log 中 写 入 一 句 话 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include «fcntl.h» 
#include <sys/types.h> 
#include <unistd.h> 
#include <sys/wait.h> 
#include <signal.h> 
#include <sys/stat.h> 


#define MAXFILE 65535 
volatile sig atomic t running = 1; 
void sigterm handler(int arg) 


( 


running - 0; 


int main() 


{ 


pid t pc; 
int i, fd, len; 
char *buf = "this is a DameonWn"; 


len = strlen (buf); 

pc = fork(); // 第 一 步 

if(pc « O) 

{ 
printf ("error fork\n"); 
exit (1); 

) 

else if(pc > 0) 
exit(0); 


setsid(); // 第 二 步 
chdir("/"); /7 第 三 步 
umask(0); // 第 四 步 
for(i = 0 ; i < MAXFILE ; i++) // 第 五 步 
close(i); 
Signal(SIGTERM, sigterm handler); 
while( running) 
t 
if((fd = open("/tmp/dameon.log", O CREAT | O WRONLY | O APPEND, 0600)) 
<0) N 








(2) 保存 代码 为 testcpp， 上 传 到 Linux， 在 命令 行 下 编译 生成 test 程序 。 然 后 重启 Linux 就 
可 以 开始 运行 了 。 
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Linux 中 的 进程 为 了 能 在 同一 项 任务 上 协调 工作 ， 它 们 彼此 之 间 必 须 能 够 进行 通信 。 对 于 一 个 
操作 系统 来 说 , 进程 间 的 通信 是 不 可 或 缺 的 。 Linux 支持 多 种 不 同方 式 的 进程 间 通 信 机 制 , 如 信号 、 
管道 、FIFO 和 System V IPC 机 制 ， 其 中 System V IPC 机 制 包括 : 信号 量 、 消 息 队 列 和 共享 内 存 3 
种 机 制 。Linux 下 的 这 些 进程 间 通 信 机 制 基 本 上 是 从 UNIX 平台 上 的 进程 间 通 信 机 制 继承 和 发 展 而 
来 的 。 下 面 我 们 分 别 阐述 这 些 进 程 通信 方式 。 

本 章 将 讲述 Linux 常用 的 3 种 进程 通信 方式 : 信号 、 管 道 和 消息 队列 。 效 果 差 别 不 是 很 大 , 大 
家 熟练 一 种 ， 基 本 上 就 可 以 应 对 一 般 的 一 线 开 发 场景 ， 当 然 熟 练 3 种 就 更 好 了 。 


6.1 信号 


6.1.1 信号 的 基本 概念 

信号 可 以 说 是 最 早 引 入 类 UNIX 系统 中 的 进程 间 通 信 方 式 之 一 , Linux 同样 支持 这 种 通信 方式 。 
信号 是 很 短 的 信息 , 可 以 被 发 送 到 一 个 进程 或 者 一 组 进程 , 发 送 给 进程 的 这 个 唯一 信息 通常 是 标识 
信号 的 一 个 数 。 信 号 可 以 从 键盘 中 断 中 产生 , 进程 在 虚拟 内 存 的 非法 访问 等 系统 错误 环境 下 也 会 有 
信号 产生 ， 信 号 也 可 以 被 shell 程序 用 来 向 其 子 进程 发 送 任务 控制 命令 等 。 信 号 异步 地 发 生 ， 也 就 
是 说 没有 确定 的 时 序 。 而 收 到 信号 的 进程 则 采取 某 种 行为 或 者 将 其 忽略 。 大 多 数 信号 可 以 被 阻塞 ， 
以 便 能 够 在 稍 后 的 时 间 里 再 采取 行动 。 

信号 机 制 可 以 说 是 在 软件 层次 上 对 中 断 机 制 的 模拟 。Linux 使 用 信号 主要 有 两 个 目的 : 一 是 让 
进程 意识 到 已 经 发 生 了 一 个 特定 的 事件 ， 二 是 迫使 进程 执行 包含 在 其 自身 代码 中 的 信号 处 理 程序 。 
对 于 每 一 个 信号 ， 进 程 可 以 采取 以 下 3 种 行为 之 一 。 

(1) 忽略 信号 。 进 程 将 忽略 这 个 信号 的 出 现 。 但 有 两 个 信号 不 能 被 忽略 : SIGKILL 和 
SIGSTOP. 

(2) 执行 与 这 个 信号 相关 的 默认 操作 。 由 内 核 预定 义 的 这 个 操作 依赖 于 信号 的 类 型 ， 默 认 操 
作 可 以 是 这 些 类 型 之 一 : 忽略 信号 ， 内 核 将 信号 丢弃 ， 信 号 对 进程 没有 任何 影响 〈 进 程 永远 不 知道 
曾经 出 现 过 该 信号 ) ; 终止 ( 杀 死 ) 进程 ， 有 时 是 指 进程 异常 终止 ， 而 不 是 进程 因 调用 exit 而 发 生 
的 正常 终止 ; 产生 核心 转 储 文件 ， 同 时 进程 终止 ,核心 转 储 文件 包含 对 进程 虚拟 内 存 的 镜像 ， 可 将 
其 加 载 到 调试 器 中 以 检查 进程 终止 时 的 状态 ; 停止 (不 是 终止 进程， 使 进程 暂停 执行 : 执行 之 前 
被 暂停 的 进程 。 
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GO 调用 相应 的 信号 处 理 函 数 来 捕获 信号 ， 进 程 可 以 事先 登记 特殊 的 信号 处 理 函数 ， 当 进程 
收 到 信号 时 , 信号 处 理 函 数 被 调用 。 当 从 信号 处 理 函数 返回 后 , 被 中 断 的 进程 将 从 其 断 点 处 重新 开 
始 执 行 。 


Linux 支持 POSIX 标准 信号 和 实时 信号 ， 但 内 核 不 使 用 实时 信号 。 我 们 可 以 用 kill 命令 来 显示 
Linux 支持 的 信号 列表 ， 比 如 : 





[root@localhost ~]# kill -1 


1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP 

6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1 
11) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM 
16) SIGSTKFLT 17) SIGCHLD 18) SIGCONT 19) SIGSTOP 20) SIGTSTP 
21) SIGTTIN 22) SIGTTOU 23) SIGURG 24) SIGXCPU 25) SIGXFSZ 
26) SIGVTALRM 27) SIGPROF 28) SIGWINCH 29) SIGIO 30) SIGPWR 
31) SIGSYS 34) SIGRTMIN 35) SIGRTMIN+1 36) SIGRTMIN*2 37) SIGRTMIN+3 


38) SIGRTMIN-4 39) SIGRTMIN-*5 40) SIGRTMIN*6 41) SIGRTMIN*7 42) SIGRTMIN-*8 

43) SIGRTMIN*9 44) SIGRTMIN-*10 45) SIGRTMIN*11 46) SIGRTMIN-*12 47) SIGRTMIN+13 

48) SIGRTMIN-*14 49) SIGRTMIN-*15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12 

53) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9 56) SIGRTMAX-8 57) SIGRTMAX-7 

58) SIGRTMAX-6 59) SIGRTMAX-5 60) SIGRTMAX-4 61) SIGRTMAX-3 (62) SIGRTMAX-2 

63) SIGRTMAX-1 64) SIGRTMAX 

上 面 的 列表 中 ， 编 号 为 1 ~ 31 的 信号 为 传统 UNIX 支持 的 信号 ， 是 不 可 靠 信 号 〈 非 实时 的 ) ; 
编号 为 32 ~ 64 的 信号 是 后 来 扩充 的 ， 称 作 可 靠 信 号 〈 实 时 信号 ) 。 不 可 靠 信 号 和 可 靠 信 号 的 区 别 
在 于 前 者 不 支持 排队 ， 可 能 会 造成 信号 丢失 ， 而 后 者 不 会 。 下 面 我 们 对 编号 小 于 SIGRTMIN 的 信 
号 进行 讨论 。 

(1) SIGHUP 

本 信号 在 用 户 终 端 连接 〈 正 常 或 非 正常 ) 结束 时 发 出 ， 通 常 是 在 终端 的 控制 进程 结束 时 ， 通 
知 同一 Session 内 的 各 个 作业 ， 这 时 它们 与 控制 终端 不 再 关联 。 登 录 Linux 时 ， 系 统 会 分 配给 登录 
用 户 一 个 终端 (Session) 。 在 这 个 终端 运行 的 所 有 程序 ， 包 括 前 台 进 程 组 和 后 台 进程 组 ， 一 般 都 
属于 这 个 Session。 当 用 户 退 出 Linux 登录 时 ， 前 台 进 程 组 和 后 台 进程 组 有 对 终端 输出 的 进程 将 会 
收 到 SIGHUP 信号 。 这 个 信号 的 默认 操作 为 终止 进程 ， 因 此 前 台 进 程 组 和 后 台 进 程 组 有 终端 输出 
的 进程 就 会 中 止 。 不 过 可 以 捕获 这 个 信号 ， 比 如 wget 能 捕获 SIGHUP 信号 ， 并 忽略 它 ， 这 样 即使 
退出 了 Linux 登录 ，wget 也 能 继续 下 载 。 此 外 ， 对 于 与 终端 脱离 关系 的 守护 进程 ， 这 个 信号 用 于 
通知 它 重新 读 取 配置 文件 。 

(2) SIGINT 

程序 终止 〈interrupt) 信号 ， 在 用 户 输入 INTR 字符 (通常 是 CtrlHC) 时 发 出 ， 用 于 通知 前 台 
进程 组 终止 进程 。 

(3) SIGQUIT 

和 SIGINT 类 似 ， 但 由 QUIT 字符 来 控制 。 进 程 因 收 到 SIGQUIT 退出 时 会 产生 core 文件, 在 
这 个 意义 上 类 似 于 一 个 程序 错误 信号 。 
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(4) SIGILL 
执行 了 非法 指令 。 通 常 是 因为 可 执行 文件 本 身 出 现 错误 ， 或 者 试图 执行 数据 段 。 堆 栈 溢出 时 
也 有 可 能 产生 这 个 信号 。 


(5) SIGTRAP 
由 断 点 指令 或 其 他 trap 指令 产生 ， 由 debugger 使 用 。 


(6) SIGABRT 
调用 abort 函数 生成 的 信号 。 


(7) SIGBUS 

非法 地 址 ， 包 括 内 存 地 址 对 齐 〈alignment) 出 错 。 比 如 访问 一 个 4 个 字 长 的 整数 ， 但 其 地 址 
不 是 4 的 倍数 。 它 与 SIGSEGYV 的 区 别 在 于 ， 后 者 是 由 于 对 合法 存储 地 址 的 非法 访问 触发 的 〈 如 访 
问 不 属于 自己 存储 空间 或 只 读 存 储 空间 的 数据 ) 。 


(8) SIGFPE 
在 发 生 致命 的 算术 运算 错误 时 发 出 。 不 仅 包括 浮 点 运算 错误 ， 还 包括 溢出 及 除数 为 0 等 其 他 
所 有 的 算术 错误 。 


(9) SIGKILL 
用 来 立即 结束 程序 的 运行 。 本 信号 不 能 被 阻塞 、 处 理 和 忽略 。 如 果 管 理 员 发 现 某 个 进程 终止 
不 了 ， 可 尝试 发 送 这 个 信号 。 


(10) SIGUSRI 
留 给 用 户 使 用 。 


(11) SIGSEGV 
试图 访问 未 分 配给 自己 的 内 存 ， 或 试图 往 没有 写 权限 的 内 存 地 址 写 数据 。 


(12) SIGUSR2 
留 给 用 户 使 用 。 


(13) SIGPIPE 

管道 破裂 。 这 个 信号 通常 在 进程 间 通 信 产 生 ， 比 如 采用 FIFO (管道) 通信 的 两 个 进程 ， 读 管 
道 没 打开 或 者 意外 终止 就 往 管道 写 ， 写 进程 会 收 到 SIGPIPE 信和 号。 此外， 用 Socket 通信 的 两 个 进 
程 ， 写 进程 在 写 Socket 的 时 候 ， 读 进程 已 经 终止 。 


(14) SIGALRM 
时 钟 定时 信号 ， 计 算 的 是 实际 时 间或 时 钟 时 间 ，alarm 函数 使 用 该 信号 。 


(15) SIGTERM 
程序 结束 (terminate) 信号 ， 与 SIGKILL 不 同 的 是 ， 该 信号 可 以 被 阻塞 和 处 理 。 通 常用 来 要 
求 程序 自己 正常 退出 ，shell 命令 kl 默认 产生 这 个 信号 。 如 果 进 程 终止 不 了 ， 我 们 才 会 尝 i 
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SIGKILL 。 


(16) SIGSTKFLT 
Linux 专用 ， 数 学 协 处 理 器 的 栈 异 常 。 


(17) SIGCHLD 
子 进 程 结 束 时 ， 父 进程 会 收 到 这 个 信号 。 如 果 父 进程 没有 处 理 这 个 信号 ， 也 没有 等 待 (wait) 
子 进 程 ， 子 进程 虽然 终止 ， 但 是 还 会 在 内 核 进程 表 中 占有 表 项 ， 这 时 的 子 进程 称 为 僵尸 进程 。 这 种 
情况 我 们 应 该 避免 〈 父 进程 或 者 忽略 SIGCHILD 信和 号， 或 者 捕捉 它 ， 或 者 等 待 它 派生 的 子 进程 ， 
或 者 父 进程 先 终止 ， 这 时 子 进 程 的 终止 自动 由 init 进程 来 接管 ) 。 
(18) SIGCONT 
让 一 个 停止 (stopped) 的 进程 继续 执行 。 本 信号 不 能 被 阻塞 ， 可 以 用 一 个 handler 来 让 程序 在 
由 停止 状态 变 为 继续 执行 时 完成 特定 的 工作 ， 例 如 重新 显示 提示 符 。 
(19) SIGSTOP 
停止 进程 的 执行 。 注 意 它 和 terminate 以 及 interrupt 的 区 别 : 该 进程 还 未 结束 ， 只 是 暂停 执行 ， 
本 信号 不 能 被 阻塞、 处 理 或 忽略 。 
(20) SIGTSTP 
停止 进程 的 运行 , 但 该 信号 可 以 被 处 理 和 和 忽略， 用户 输 入 SUSP 字符 时 (通常 是 Ctrl+Z) 发 出 
这 个 信号 。 
(21) SIGTTIN 
当 后 台 作 业 要 从 用 户 终端 读数 据 时 ， 该 作业 中 的 所 有 进程 会 收 到 SIGTTIN 信和 号。 默认 时 这 些 
进程 会 停止 执行 。 
(22) SIGTTOU 
类 似 于 SIGTTIN， 但 在 写 终端 (或 修改 终端 模式 ) 时 收 到 。 


(23) SIGURG 
有 “紧急 ”数据 或 带 外 Cout-of-band) 数据 到 达 socket 时 产生 。 


(24) SIGXCPU 
超过 CPU 时 间 资 源 限制 。 这 个 限制 可 以 由 getrlimivsetrlimit 来 读 取 /改变 。 


(25) SIGXFSZ 
进程 企图 扩大 文件 ， 以 至 于 超过 文件 大 小 资源 限制 。 


(26) SIGVTALRM 
虚拟 时 钟 信号 。 类 似 于 SIGALRM， 但 是 计算 的 是 该 进程 占用 的 CPU 时 间 。 


(27) SIGPROF 
类 似 于 SIGALRM/SIGVTALRM， 但 包括 该 进程 用 的 CPU 时 间 以 及 系统 调用 的 时 间 。 
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(28) SIGWINCH 
窗口 大 小 改变 时 发 出 。 


(29) SIGIO 
文件 描述 符 准 备 就 绪 ， 可 以 开始 进行 输入 /输出 操作 。 


(30) SIGPWR 

电源 失败 。 

(31) SIGSYS 

非法 的 系统 调用 。 

在 以 上 列 出 的 信号 中 ， 程 序 不 可 捕获 、 阻 塞 或 忽略 的 信号 有 : SIGKILL 和 SIGSTOP 。 不 能 
恢复 至 默认 动作 的 信号 有 : SIGILL 和 SIGTRAP。 默 认 会 导致 进程 流产 的 信号 有 : SIGABRT、 
SIGBUS、 SIGFPE、 SIGILL, SIGIOT, SIGQUIT, SIGSEGV, SIGTRAP, SIGXCPU、 SIGXFSZ. 
默认 会 导致 进程 退出 的 信号 有 : SIGALRM. SIGHUP, SIGINT, SIGKILL, SIGPIPE, SIGPOLL, 
SIGPROF、SIGSYS、SIGTERM、SIGUSR1、SIGUSR2、SIGVTALRM。 默认 会 导致 进程 停止 的 
信号 有 : SIGSTOP、SIGTSTP、SIGTTIN、SIGTTOU。 默认 进程 忽略 的 信号 有 : SIGCHLD、 SIGPWR、 
SIGURG、SIGWINCH。 

总 的 来 说 ， 可 以 归纳 为 下 列 5 种 方式 : 


(1) 硬件 异常 产生 信号 。 比 如 无 效 的 内 存 访问 将 产生 SIGSEGV 信号 ， 而 除数 为 0 时 将 产生 
SIGFPE 信号 等 。 这 些 条 件 通常 由 硬件 检测 到 ， 并 将 其 通知 给 内 核 ， 内 核 为 该 条 件 发 生 时 正在 运行 
的 进程 产生 适当 的 信号 。 

(2) 软件 条 件 触发 信号 。 当 内 核 检测 到 某 种 软件 条 件 已 经 发 生 ， 并 将 其 通知 给 有 关 进 程 时 ， 
也 产生 信号 ， 比 如 进程 所 设置 的 定时 器 到 期 。 

(3) 用 户 按 某 些 终端 键 时 产生 信号 。 比 如 用 户 在 键盘 终端 上 按 Ctr C 键 将 产生 SIGINT 信号 。 

(4) 用 户 使 用 Kill 命令 将 信号 发 送 给 进程 。kill 命令 的 语法 是 这 样 的 : 

kill [参数 ] [进程 号 ] 

其 中 ， 参 数 通常 取 如 下 几 项 。 

-l: 使 用 “-1” 参 数 会 列 出 全 部 的 信号 名 称 。 

-a: 当 处 理 当 前 进程 时 ， 不 限制 命令 名 和 进程 号 的 对 应 关系 。 

-p: 指定 kill 命令 只 打印 相关 进程 的 进程 号 ， 而 不 发 送 任何 信号 。 
-S: 指定 发 送信 号 。 

-u: 指定 用 户 。 

一 般 可 以 用 该 命令 终止 一 个 失控 的 后 台 进 程 ， 比 如 希望 尽快 终止 一 个 进程 ， 可 以 使 用 命令 : 
kill -9 pid。 


C5) 进程 使 用 系统 调用 函数 kill 将 信号 发 送 给 一 个 进程 或 一 组 进程 。 注 意 ， 这 个 系统 调用 kill 
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不 是 杀 死 进程 ， 而 是 一 个 进程 发 送信 号 给 另 一 个 进程 。 其 中 , 要求 接 收 信号 进程 和 发 送信 号 进程 的 
所 有 者 相同 ， 或 者 发 送信 号 进程 的 所 有 者 是 超级 用 户 。 

Linux 内 核 中 并 没有 专门 的 机 制 来 区 分 不 同 信号 的 相对 优先 级 。 也 就 是 说 ， 当 有 多 个 信号 在 同 
一 时 刻 发 出 时 ， 进 程 可 能 会 以 任意 的 顺序 接收 到 信号 并 进行 处 理 。 此 外 ， 当 进程 调用 信号 处 理 函 数 
处 理 某 个 信号 时 ,一 般 会 自动 阻塞 相同 的 信号 ,直到 信号 处 理 结束 .Linux 通过 存储 在 进程 task_struct 
结构 中 的 信息 来 实现 信号 ， 它 维护 着 挂 起 的 信号 〈 已 经 产生 但 还 没有 被 接收 的 信号 ) 、 阻 塞 信号 的 
掩 码 以 及 进程 处 理 每 个 可 能 信号 的 信息 等 。 信号 并 非 一 产生 就 立刻 交付 给 进程 , 而 是 必须 等 到 进程 
再 次 运行 时 才 交 付 给 进程 。 进程 在 系统 调用 退出 之 前 , 它 都 会 检查 是 否 有 可 以 立刻 发 送 的 非 阻 塞 信 
号 。 当 然 ， 进 程 可 以 选择 去 等 待 信号 ， 此 时 进程 将 一 直 处 于 可 中 断 状 态 直 到 信号 出 现 。 


6.1.2 与 信号 相关 的 系统 调用 

通过 系统 调用 ， 进 程 可 以 向 其 他 进程 发 送信 号 ， 也 可 以 更 改 默 认 的 信号 处 理 函 数 、 阻 塞 信 号 
的 掩 码 以 及 检查 是 否 有 挂 起 的 信号 等 。 与 信号 相关 的 系统 调用 主要 有 Kill. sigaction() . 
sigprocmask(). sigpending(). signal()55:. 


1. 使 用 kill 发 送信 号 

系统 调用 kill0 用 来 向 一 个 进程 或 一 个 进程 组 发 送 一 个 信号 ， 其 中 第 一 个 参数 决定 信号 发 送 的 
对 象 ， 该 系统 调用 声明 如 下 : 

#include <sys/types. h> 


#include <signal. h> 
int kill(pid t pid, int sig); 


其 中 ，pid 可 能 的 选择 有 以 下 4 种 : 


CD 当 pid>0 时 ，pid 是 信号 欲 送 往 的 进程 的 标识 。 

(2) 当 pid=0 时 ， 信 号 将 送 往 所 有 与 调用 kilil0 的 那个 进程 属于 同一 个 使 用 组 的 进程 。 

G) 当 pid=-1 时 , 信号 将 送 往 所 有 调用 进程 有 权 给 其 发 送信 号 的 进程 , 除了 进程 1 (init) 外。 

(4) 当 pid<-1 时 ， 信 号 将 送 往 以 -pid 为 组 标识 的 进程 。 

参数 sig 表示 准备 发 送 的 信号 代码 ， 如 果 其 值 为 零 ， 则 没有 任何 信号 送出 ， 但 是 系统 会 执行 错 
误 检查 ， 通 常会 利用 sig 值 为 0 来 检验 某 个 进程 是 否 仍 在 执行 。 当 函数 成 功 执行 时 ， 返 回 0， 否 则 
返回 -1, 此 时 errno 可 以 得 到 错误 码 , 错误 码 值 EINVAL 表示 指定 的 信号 码 无 效 ( 参 数 sig 不 合法 ) ， 
错误 码 值 EPERM 表示 权限 不 够 ， 无 法 传送 信号 给 指定 进程 ， 错 误 码 值 ESRCH 表示 参数 PID 所 指 
定 的 进程 或 进程 组 不 存在 。 
【 例 6.1】 使 用 kill 发 送信 号 终止 目标 进程 
(1) 打开 UE， 输 入 代码 如 下 : 





#include <sys/wait.h> 
#include <sys/types.h> 
#include <stdio.h> 
#include <stdlib.h> 
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#include «signal.h» 
#include <unistd.h> 
int main (void) 
{ 
pid t childpid; 
int status; 
int retval; 


childpid = fork(); // 创 建 子 进程 
if (-1 == childpid) // 判 断 是 否 创 建 失败 
t 
perror("fork()"); 
exit(EXIT FAILURE); 
) 
else if (0 -- childpid) 
t 
puts ("In child process"); 
sleep (100) ;// 让 子 进程 睡眠 ， 以 便 查 看 父 进程 的 行为 
exit(EXIT SUCCESS); 
) 
else 


( 


if (0 == (waitpid (childpid, &status,WNOHANO) ) ) // 判 断 子 进程 是 否 已 经 退出 


{ 


retval=kill(childpid,SIGKILL) ;// 发 送 SIGKILL 给 子 进程 ， 要 求 其 停止 运行 


if (retval) // 判 断 是 否 发 生 信号 

{ 
puts("kill failed."); 
perror("kill"); 
waitpid(childpid, &status, 0); 

} 

else 

t 
printf("$d killedWn", childpid); 

) 


) 


exit(EXIT SUCCESS); 
) 


(2) 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
39759 killed 


上 面 例子 的 代码 首先 创建 了 一 个 子 进程 ， 然 后 让 子 进程 休眠 一 会 儿 ， 在 父 进程 中 判断 子 进程 
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是 否 存在 ， 如 果 存 在 ， 则 发 送 SIGKILL 信号 给 子 进程 ， 让 其 退出 。 其 中 ， 函 数 waitpid 会 暂时 停止 
目前 进程 的 执行 ， 直 到 有 信号 来 到 或 子 进程 结束 ， 声 明 如 下 : 
#include <sys/types.h> 


#include <sys/wait.h> 
pid t waitpid(pid t pid, int *status, int options); 


其 中 ， 参 数 pid 为 欲 等 待 的 子 进程 识别 码 ， 不 同 的 取 值 含义 不 同 ， 具 体 如 下 : 


当 pid<-1 时 ， 等 待 进程 组 识别 码 为 pid 绝对 值 的 任何 子 进程 。 
当 pid=-1 时 ， 等 待 任何 子 进程 ， 相 当 于 wait()。 
当 pid=0 时 ， 等 待 进程 组 识别 码 与 目前 进程 相同 的 任何 子 进程 。 
当 pid>0 时 ， 等 待 任何 子 进程 识别 码 为 pid 的 子 进程 。 

参数 options 提供 了 一 些 额外 的 选项 来 控制 waitpid， 常 见 的 有 WNOHANG 或 WUNTRACED， 
WNOHANG 表示 若 PID 指定 的 子 进程 没有 结束 ， 则 waitpid() 函 数 返 回 0， 不 予以 等 待 ， 若 结束 ， 
则 返回 该 子 进程 的 ID。WUNTRACED 表示 若 子 进程 进入 暂停 状态 ， 则 马上 返回 ， 若 子 进程 处 于 结 
束 状态 ， 则 不 予以 理会 。 如 果 不 想 使 用 options， 可 以 把 options 设 为 NULL。 参 数 status 用 来 存放 
子 进程 的 结束 状态 。 如 果 函 数 执行 成 功 ， 则 返回 子 进程 识别 码 (PID) ， 如 果 有 错误 发 生 ， 则 返回 
值 -1， 失 败 原 因 存 于 erno m. 


2. 使 用 sigaction 查询 或 设置 信号 处 理 方式 
系统 调用 sigaction() 可 以 用 来 查询 或 设置 信号 处 理 方式 。 函 数 声明 如 下 : 








#include <signal.h> 

int sigaction(int signum, const struct sigaction *act,struct sigaction 
*oldact); 

参数 signum 表示 要 操作 的 信号 , 可 以 指定 SIGKILL 和 SIGSTOP 以 外 的 所 有 信号 ; act 表示 要 
设置 的 对 信号 的 新 处 理 方式 ， 它 是 一 个 结构 体 指针 ; oldact 表示 原来 对 信号 的 处 理 方式 。 如 果 函 数 
执行 成 功 就 返回 0， 和 否则 返回 -1。 结 构 体 struct sigaction 用 来 描述 对 信号 的 处 理 ， 定 义 如 下 : 

struct sigaction 

{ 


void (*sa handler) (int); 

void (*sa sigaction) (int, siginfo t *, void *); 
sigset t sa mask; 

int sa flags; 

void (*sa restorer) (void); 


1 

在 这 个 结构 体 中 , 成 员 sa handler 是 一 个 函数 指针 , 指向 一 个 信号 处 理 函 数 ; 成 员 sa sigaction 
则 是 另 一 个 信号 处 理 函 数 ， 它 有 3 个 参数 ， 可 以 获得 关于 信号 的 更 详细 的 信息 ， 当 sa flags 成 员 
的 值 包 含 SA_SIGINFO 标志 时 ， 系 统 将 使 用 sa_sigaction 函数 作为 信号 处 理 函数 ， 否 则 使 用 
sa handler 作为 信号 处 理 函 数 。 在 某 些 系统 中 ， 成 员 sa handler 与 sa_sigaction 被 放 在 联合 体 中 ， 
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因此 使 用 时 不 要 同时 设置 。 成 员 sa mask 用 来 指定 在 信号 处 理 函数 执行 期 间 需 要 被 屏蔽 的 信号 ， 特 
别 是 当 某 个 信号 被 处 理 时 ， 它 自身 会 被 自动 放 入 进程 的 信号 掩 码 ， 因 此 在 信号 处 理 函 数 执行 期 间 ， 


这 个 信号 





不 会 再 度 发 生 。 


sa_flags 成 员 用 于 指定 信号 处 理 的 行为 ， 它 可 以 是 以 下 值 的 “ 按 位 或 ”组 合 。 


SA RESTART: 使 被 信号 打 断 的 系统 调用 自动 重新 发 起 。 

SA NOCLDSTOP 使 父 进程 在 它 的 子 进程 暂停 或 继续 运行 时 不 会 收 到 SIGCHLD 信 
*. 

SA NOCLDWAIT: 使 父 进 程 在 它 的 子 进程 退出 时 不 会 收 到 SIGCHLD 信号 ， 这 时 
子 进程 如 果 退 出 也 ， 不 会 成 为 僵尸 进程 。 

SA NODEFER: 使 对 信号 的 屏蔽 无 效 ， 即 在 信号 处 理 函数 执行 期 间 ， 仍 能 发 出 这 个 
信号 。 

SA RESETHAND: 信号 处 理 之 后 重新 设置 为 默认 的 处 理 方式 。 

SA SIGINFO: 使 用 sa sigaction 成 员 而 不 是 sa handler 作为 信号 处 理 函 数 。 


成 员 re. restorer 则 是 一 个 已 经 废弃 的 数据 域 ， 不 要 使 用 。 
如 果 和 希望 能 用 相同 方式 处 理 某 信号 的 多 次 出 现 , 最 好 用 sigaction, 因为 它 设 置 的 响应 函数 设置 
后 就 一 直 有 效 ， 不 会 重 置 。 
下 面 用 一 个 小 例子 来 说 明 sigaction 函数 的 使 用 。 
【 例 6.2】 系 统 调用 sigaction 函数 的 简单 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <unistd.h> 
#include <signal.h> 
#include <errno.h> 


static void sig usr(int signum) 


t 


if (signum == SIGUSR1) 
t 

printf("SIGUSR1 received in"); 
} 
else if (signum == SIGUSR2) 
t 

printf("SIGUSR2 receivedin"); 
b 
else 
t 

printf("signal $d receivedWn", signum); 
) 
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int main(void) 
t 
char buf[512]; 
int n; 
struct sigaction sa usr; 
sa usr.sa flags = 0; 
sa usr.sa handler = sig usr;  // 信 号 处 理 函数 


sigaction (SIGUSR1，&sa usr, NULL); // 设 置信 号 处 理 方式 
sigaction(SIGUSR2, &sa usr, NULL); // 设 置信 号 处 理 方式 
printf("My PID is $dWn", getpid()); // 打 印 当 前 进程 的 pid 
while (1) 


{ 
if ((n = read(STDIN FILENO, buf, 511)) == -1)// 从 标准 输入 读 入 字符 


t 
if (errno == EINTR) 


t 


printf("read is interrupted by signalin"); 


) 
) 
else 
t 
buf[n] = 'N0'; 
printf("$d bytes read: $sWMn", n, buf); 


) 


return 0; 


H 
(2) 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
My PID is 58471 


此 时 ， 我 们 可 以 另外 打开 一 个 终端 ， 然 后 输入 发 送信 号 的 命令 : 
[rootélocalhost ~]# kill -USR1 58471 
这 样 程 序 就 会 收 到 信号 ， 并 打印 信息 了 : 


SIGUSR1 received 
read is interrupted by signal 


这 说 明 用 sigaction 注册 信号 处 理 函 数 时 ， 不 会 自动 重新 发 起 被 信号 打 断 的 系统 调用 。 如 果 需 
要 自动 重新 发 起 ， 则 要 设置 SA RESTART 标志 ， 比 如 在 上 例 中 可 以 进行 类 似 sa usrsa flags = 
SA_RESTART; 的 设置 。 
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3. 使 用 sigprocmask 检测 或 更 改 信号 屏蔽 字 


系统 调用 sigprocmask(O 可 以 检测 或 更 改 其 信号 屏蔽 字 。 一 个 进程 的 信号 屏蔽 字 规 定 了 当前 阻 
塞 而 不 能 递送 给 该 进程 的 信号 集 。 函 数 声明 如 下 : 














#include <signal.h> 
int sigprocmask(int how, const sigset t *set, sigset t *oldset); 


其 中 ， 参 数 how 用 于 指定 信号 修改 的 方式 ， 可 能 的 选择 有 3 种 : 


€ SIG BLOCK 表示 加 入 信号 到 进程 屏蔽 。 
€ SIG UNBLOCK 表示 从 进程 屏蔽 里 将 信号 删除 。 
€ SIG SETMASK 表示 将 set 的 值 设 定 为 新 的 进程 屏蔽 。 


参数 set 为 指向 信号 集 的 指针 ， 在 此 专 指 新 设 的 信号 集 ， 如 果 仅 想 读 取现 在 的 屏蔽 值 ， 可 将 其 
设置 为 NULL; 参数 oldset 也 是 指向 信号 集 的 指针 ， 在 此 存放 原来 的 信号 集 。 如 果 函 数 成 功 执行 ， 
返回 0， 失 败 则 返回 -1，errno 被 设 为 EINVAL。 

下 面 用 一 个 小 例子 来 说 明 函 数 sigprocmask 的 使 用 。 


【 例 6.3】 系 统 调 用 sigprocmask 的 使 用 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <unistd.h> 
#include <signal.h> 


void handler (int sig) //SIGINT 信 号 处 理 函 数 
printf("Deal SIGINT"); 
int main() 


sigset t newmask; 
sigset t oldmask; 
sigset t pendmask; 


struct sigaction act; 

act.sa handler = handler; //handlez 为 信号 处 理 函数 首 地 址 

sigemptyset(&act.sa mask); 

act.sa flags - 0; 

sigaction (SIGINT, &act, 0); // 信 号 捕捉 函数 ， 捕 捉 Ctrl1+C 

sigemptyset (&newmask) ;// 初 始 化 信号 量 : 

sigaddset (&newmask, SIGINT) ;// 将 SIGINT 添 加 到 信号 量 集 中 

sigprocmask(SIG_BLOCK，&newmask，&oldmask) ; // 将 newmask 中 的 SIGINT 阻 塞 掉 ， 并 
保存 当前 信号 屏蔽 字 到 oldmask 

sleep (5) ; // 休 眠 5 秒 钟 ， 说 明 : 在 5 秒 休 眠 期 间 ， 任 何 STGINT 信 号 都 会 被 阻塞 ， 如 果 在 5 秒 内 收 
到 任何 键盘 的 ctrl1+Cc 信 号 ， 则 此 时 会 把 这 些 信 息 存在 内 核 的 队列 中 ， 等 待 5 秒 结束 后 ， 可 能 要 处 理 此 信号 

sigpending (&pendmask) ; // 检 查 信 号 是 悬而未决 的 ， 这 个 函数 后 面 会 讲 到 
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// 判 断 信号 SIGINT 是 否 悬 而 未 决 。 所 谓 悬 而 未 决 ， 是 指 SIGINT 被 阻塞 还 没有 被 处 理 
if (sigismember(&pendmask, SIGINT)) 
printf(" SIGINT pending Win"); 
sigprocmask(SIG SETMASK, &oldmask, NULL) ;// 恢 复 被 屏蔽 的 信号 SIGINT 


// 此 处 开始 可 以 处 理 信号 

printf("SIGINT unblocked in"); 

sleep(5); // 在 这 个 时 间 段 内 ， 如 果 按 下 ctr1+C, 则 会 调用 函数 handler 
return (0); 


} 
Q) 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[root@localhost test]# ./test 

^C^C^C SIGINT pending 

Deal SIGINTSIGINT unblocked 

^CDeal SIGINT[rootG8localhost test]# 

程序 运行 后 ， 在 开始 的 5 秒 内 ， 如 果 按 Ctrl+C 键 ， 则 不 会 有 反应 ， 因 为 这 个 信号 被 我 们 屏蔽 
了 ， 过 了 5 秒 后 ， 再 按 下 Ctrl+C 键 ， 将 进入 SIGINT 信号 的 处 理 函数 ， 即 打印 “Deal SIGINT” . 
这 个 例子 演示 了 更 改 信号 屏蔽 字 来 屏蔽 某 个 信号 。 

4. 使 用 sigpending 检查 是 否 有 挂 起 的 信号 

系统 调用 sigpending() 用 来 检查 进程 是 否 有 挂 起 的 信号 ， 也 就 是 已 经 产生 但 被 阻塞 的 信号 。 函 
数 声明 如 下 : 


#include <signal.h> 
int sigpending(sigset t *set); 


其 中 ， 信 号 集 通 过 set 参数 返回 。 如 果 函 数 执行 成 功 ， 返 回 0， 错 误 返 回 -1。 

系统 调用 sigpending 在 上 例 实现 过 了 ， 用 法 可 以 参考 上 例 ， 这 里 不 再 歼 述 。 

5. 使 用 signal 设置 信号 处 理 程序 

系统 调用 signal() 来 为 信号 设置 一 个 新 的 信号 处 理 程序 ， 可 以 将 这 个 信号 处 理 程序 设置 为 一 个 
用 户 指定 的 函数 ， 或 者 设置 为 宏 SIG ING 和 SIG_DFL。 函 数 声明 如 下 : 








#include <signal. h> 

typedef void (*sighandler t) (int); 

sighandler t signal(int signum, sighandler t handler); 

参数 signum 是 我 们 要 处 理 的 信号 ， 指 明了 所 要 处 理 的 信号 类 型 ， 它 可 以 取 除 了 SIGKILL 和 
SIGSTOP 外 的 任何 一 种 信号 ; 参数 handler 描述 了 与 信号 关联 的 动作 ， 它 可 以 取 以 下 3 种 值 。 


(1) SIG ING 
7E SIG ING 代表 忽略 信号 ， 比 如 signa(SIGINT,SIG ING ) 表 示 忽 略 SIGINT 信号 ，SIGINT 
信号 由 InterruptKey 产生 ， 通 常 是 用 户 按 了 CTRL +C 键 或 者 DELETE 键 产生 。 
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(2) SIG_DFL 
E SIG_DFL 表示 恢复 对 信号 的 系统 默认 处 理 。 比 如 signal(SIGINT ,SIG DFL ): 表 示 对 信号 
SIGINT 进行 默认 处 理 ， 即 终止 该 进程 。 这 种 方式 是 否 显 式 地 写 signal 效果 都 一 样 。 





(3) sighandler t 类 型 的 函数 指针 

此 时 ， 参 数 handler 是 sighandler t 类 型 的 函数 指针 ， 指 向 一 个 我 们 自己 定义 的 函数 ， 用 来 响 
应 对 信号 signum 的 处 理 。 而 且 ， 这 个 自 定义 信号 处 理 函 数 的 参数 是 signum。 进 程 只 要 接收 到 类 型 
为 signum 的 信号 ， 不 管 其 正在 执行 程序 的 哪 一 部 分 ， 都 立即 执行 handler 函数 。 当 handler 函数 执 
行 结束 后 ， 控 制 权 返回 进程 被 中 断 的 那 一 点 继续 执行 。 

如 果 函 数 执行 成 功 ， 则 返回 该 信号 上 一 次 的 handler 值 ， 如 果 出 错 ， 则 返回 SIG_ERR， 此 时 可 
以 通过 错误 码 errno 获得 。 

函数 signal 类 似 于 sigaction, 不 过 两 者 是 有 区 别 的 , 首先 signal 是 ANSI C 标准 的 , 而 sigaction 
符合 POSIX 标准 。 其 次 ，signal E sigaction 使 用 简单 ,但 要 注意 ， 如 果 在 C 语言 中 使 用 ， 并 且 gec 
编译 时 加 上 -std=c99 时 ，signal 注册 的 信号 在 sa. handler 被 调用 之 前 会 把 信号 的 sa. handler 指针 恢 
5i, M signal 函数 注册 的 信号 处 理 函 数 只 会 被 调用 一 次 , 之 后 收 到 这 个 信号 将 按 默认 方式 处 理 ， 如 
果 编 译 时 没有 加 上 -std=c99， 则 signal 注册 的 信号 在 处 理 信号 时 不 会 恢复 sa handler 指针 ， 下 次 依 
旧 会 使 用 signal 定义 的 信号 处 理 行为 来 处 理 。 在 C++ 程序 中 ，signal 注册 的 信号 不 会 在 sa_handler 
被 调用 之 前 把 信号 的 sa_handler 指针 恢复 。 

而 sigaction 注册 的 信号 在 处 理 信 号 时 不 管 编译 时 是 否 加 上 -std=c99， 都 不 会 恢复 sa handler 指 
针 ， 下 次 收 到 该 信号 时 ， 依 旧 会 根据 sigaction 注册 的 信号 处 理 行为 来 处 理 。 


【 例 6.4] 2K SIGINT 信和 号 
(1) 打开 UE， 输 入 代码 如 下 : 





#include <stdio.h> 

#include <signal.h> 

int main(int argc, char *argv[]) 

t 
signal(SIGINT，SIG_IGN) ; // 忽 略 SIGINT 信 号 
while (1); 
return 0; 


H 
(2) 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
EINCTONE CIC CONESE 


可 以 看 到 ， 程 序 运行 时 ， 我 们 多 次 按 下 Ctrl+C 键 ,但 并 没有 使 得 程序 退出 ,说 明 信 和 号 SIGINT 
被 忽略 了 。 


【 例 6.5】 自 定义 信号 SIGINT 的 处 理 
(1) 打开 UE， 输 入 代码 如 下 : 
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#include <stdio.h> 
#include <signal.h> 
typedef void (*signal handler) (int); 
void signal handler fun(int signum) ( 
printf("catch signal $dWMn", signum); 
) 
int main(int argc, char *argv[]) 
t 
Signal(SIGINT, signal hander fun); // 注 册 信号 SIGINT 的 处 理 行为 
while(1); 
return 0; 


} 
(2) 保存 文件 为 test.cpp， 然 后 上 传 到 Linux 下 ， 输 入 编译 命令 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

^Ccatch signal 2 

^Ccatch signal 2 

^Ccatch signal 2 

^Ccatch signal 2 


可 以 看 到 ， 每 次 按 下 Ctrl+C 键 的 时 候 ， 都 会 执行 signal_handler_fun 函数 ， 而 不 是 退出 程序 。 
6.2 管道 


6.2.1 管道 的 基本 概念 

所 谓 管道 ， 是 指 用 于 连接 读 进程 和 写 进程 ， 以 实现 它们 之 间 通 信 的 共享 文件 ， 故 又 称 管道 文 
件 。 这 种 进程 通信 方式 首创 于 UNIX 系统 , 因 它 能 传送 大 量 的 数据 并 且 十 分 有 效 ， 很 多 操作 系统 都 
引入 了 这 种 通信 方式 ， 当 然 Linux 也 支持 管道 。 

可 以 说 管道 是 一 种 以 先进 先 出 的 方式 保存 一 定数 量 数据 的 特殊 文件 ， 而 且 管 道 一 般 是 单 向 的 。 
写 进程 将 数据 写 入 管道 的 一 端 , 读 进程 从 管道 另 一 端 读 取 数据 , 腾 出 空间 以 便 写 进程 写 入 新 的 数据 ， 
所 有 的 数据 只 能 读 取 一 次 。Linux 下 管道 的 大 小 有 一 定 的 限制 。 实 际 上 ， 管 道 是 一 个 固定 大 小 的 组 
冲 区 。 在 Linux 中 ， 该 缓冲 区 的 大 小 为 一 个 页 面 ， 即 4KB， 因 此 管道 的 大 小 不 像 文件 那样 可 以 任 
意 增长 。 

为 了 协调 双方 的 通信 ， 管 道 通 信 机 制 必须 能 够 提供 读 写 进程 之 间 的 同步 机 制 。 如 果 一 个 进程 
试图 写 入 一 个 已 满 的 管道 , 在 默认 情况 下 , 系统 会 自动 阻塞 该 进程 , 直到 管道 能 够 有 空间 接收 数据 。 
同样 ， 如 果 试 图 读 一 个 空 的 管道 ， 进 程 也 会 被 阻塞 ， 直 到 管道 有 可 读 的 数据 。 此 外 ， 如 果 一 个 进程 
以 读 方式 打开 一 个 管道 , 而 没有 另外 的 进程 以 写 方式 打开 该 管道 ， 则 同样 会 造成 该 进程 阻塞 (因为 
没有 数据 会 写 到 这 个 管道 里 ) 。 同 样 ， 当 一 个 进程 试图 对 没有 读 进 程 的 管道 进行 写 操作 时 ， 则 会 出 
现 异常 ， 导 致 进程 终止 。 

管道 是 一 个 进程 连接 数据 流 到 另 一 个 进程 的 通道 ， 它 通常 用 作 把 一 个 进程 的 输出 通过 管道 连 
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接 到 另 一 个 进程 的 输入 。 在 Shel 下 ， 可 以 通过 符号 “|” 来 使 用 管道 。 比 如 ， 当 前 路 径 下 有 一 个 文 
件 夹 perl5， 在 Shell 中 输入 命令 : ls -1| grep per， 我 们 知道 ls 命令 〈 其 实 也 是 一 个 进程 ) 会 把 当前 
目录 中 的 文件 或 文件 夹 都 列 出 来 , 现在 把 本 来 要 输出 到 屏幕 上 的 数据 通过 管道 输出 到 grep 进程 中 ， 
作为 grep 进程 的 输入 ， 然 后 grep 进程 对 输入 的 信息 进行 筛选 ， 把 存在 per 字符 串 的 那 行 (ls -1 是 
一 行 一 行 的 字符 串 ) 打印 在 屏幕 上 : 


[root@localhost ~]# ls -l|grep per 
drwxr-xr-x. 2 root root 6 12H 17 2016 per15 


6.22 ”管道 读 写 的 特点 


管道 读 写 是 通过 标准 的 无 缓冲 的 输入 输出 系统 调用 read0 和 write0 实 现 的。 系统 调用 read 0 将 
从 一 个 由 管道 文件 描述 符 所 指 的 管道 中 读 取 指定 的 字 节 数 到 缓冲 区 中 。 如果 调用 成 功 ,函数 将 返回 
实际 所 读 的 字 节 数 。 如 果 失 败 ， 将 返回 -1。 当 然 由 于 管道 的 特殊 性 ， 管 道 的 读 取 有 其 自身 的 特点 : 


(1) 所 有 的 读 取 操作 总 是 从 管道 当前 位 置 开 始 读 ， 不 支持 文件 指针 的 移动 。 

(2) 如 果 管 道 没有 被 其 他 进程 以 写 方式 打开 ， 那 么 read0 系 统 调 用 将 返回 0， 也 就 是 遇 到 文件 
末端 的 条 件 。 

(3) 如 果 管 道中 没有 数据 ， 也 就 是 管道 为 空 ， 默 认 情 况 下 read() 系 统 调用 将 会 阻塞 ， 直 到 有 
数据 被 写 进 该 管道 或 者 该 管道 被 关闭 。 当 然 ， 也 可 以 通过 feuntl() 系 统 调用 对 管道 进行 设置 ， 如 在 
管道 为 空 的 情况 下 让 read0) 系 统 调用 立即 返回 。 


数据 通过 系统 调用 write0 写 入 管道 。write0 系 统 调用 将 数据 从 缓冲 区 向 管道 文件 描述 符 所 指 的 
管道 中 写 入 数据 。 如 果 该 系统 调用 成 功 ， 将 返回 实际 所 写 的 字 节 数 ， 和 否则 返回 -1。 当 然 ， 由 于 管道 
的 特殊 性 ， 管 道 的 写 操作 也 有 其 自身 的 特点 : 


(1) 每 一 次 的 写 请 求 操作 总 是 附加 在 管道 的 末端 。 

(2) 当 有 多 个 对 同一 管道 的 写 请 求 发 生 时 ,系统 保证 小 于 或 等 于 AKB 大 小 的 写 请 求 操作 不 会 
交叉 进行 。 

(3) 如 果 试 图 对 一 个 没有 被 任何 进程 以 读 方 式 打 开 的 管道 进行 写 操作 ， 则 将 会 产生 SIGPIPE 
信号 。 默 认 情 况 下 (假如 SIGP1PE 信号 没有 被 捕获 ) ， 该 进程 将 会 被 系统 终止 。 

(4) 默认 情况 下 ， 对 管道 的 写 操作 请 求 会 导致 进程 阻塞 ， 因 为 如 果 设 备 处 于 忙 状态 ，write() 
系统 调用 会 被 阻塞 并 且 将 被 延迟 写 入 ， 当 然 也 可 以 通过 fcntl0 系 统 调用 对 管道 进行 设置 。 


6.2.3 ”管道 的 局 限 性 
管道 有 下 列 几 个 局 限 性 : 


(1) 数据 自己 读 却 不 能 自己 写 。 

(2) 数据 一 旦 被 读 走 ， 便 不 在 管道 中 存在 ， 不 可 反复 读 取 。 

(3) 由 于 管道 采用 半 双 工 通 信 方 式 ， 因 此 数据 只 能 在 一 个 方向 上 流动 。 
(D. 只 能 在 有 公共 祖先 的 进程 间 使 用 管道 。 
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6.2.4 创建 管道 函数 pipe 
管道 是 一 种 基本 的 IPC 机 制 ， 由 pipe 函数 创建 ， 该 函数 如 下 : 
int pipe(int filedes[2]); 


其 中 , 参数 filedes 表示 两 个 文件 描述 符 , filedes[0] 指 向 管道 的 读 端 , filedes[1] 指 向 管道 的 写 端 。 
如 果 函 数 调用 成 功 返 回 0， 调 用 失败 返回 -1。 

调用 pipe 函数 时 ， 在 内 核 中 开辟 一 块 缓冲 区 〈 称 为 管道 ) 用 于 通信 ， 它 有 一 个 读 端 和 一 个 写 
端 ， 然 后 通过 filedes 参数 传 出 给 用 户 程序 两 个 文件 描述 符 ，filedes[0] 指 向 管道 的 读 端 ，filedes[1] 
指向 管道 的 写 端 (很 好 记 ， 就 像 0 是 标准 输入 ，1 是 标准 输出 一 样 ) 。 所 以 管道 在 用 户 程序 中 看 起 
来 就 像 一 个 打开 的 文件 , 通过 read(filedes[0]); 或 者 write(filedes[1]); 向 这 个 文件 读 写 数据 其 实 是 在 读 
写 内 核 缓 冲 区 。 

值得 注意 的 是 ， 管 道 创 建 时 默认 打开 了 文件 描述 符 ， 且 默认 是 以 阻塞 〈block) 模式 打开 的 。 


6.2.5 ” 读 写 管道 函数 read/write 


读 写 管道 的 函数 和 读 写 文件 的 函数 一 样 , 都 是 read 和 write. 这 两 个 函数 我 们 在 第 4 章 讲 过 了 ， 
这 里 不 再 歼 述 。 但 有 两 点 要 注意 : 


CD 当 没 有 数据 可 读 时 ，read 调用 阻塞 ， 即 进程 暂停 执行 ， 一 直 等 到 有 数据 来 到 为 止 。 
COD 当 管 道 满 的 时 候 ，write 调用 阻塞 ， 直 到 有 进程 读 取 数 据 。 


6.2.6 等 待 子 进 程 中 断 或 结束 的 函数 wait 

wait 函数 用 于 等 待 子 进程 中 断 或 结束 ， 进 程 一 旦 调用 了 wait， 就 立即 阻塞 自己 ， 由 wait 自动 
分 析 当 前 进程 的 某 个 子 进程 是 否 已 经 退出 ， 如 果 让 它 找 到 了 一 个 已 经 变 成 僵尸 的 子 进 程 ，wait 就 
会 收集 这 个 子 进程 的 信息 ， 并 把 它 彻底 销毁 后 返回 ; 如 果 没 有 找到 这 样 一 个 子 进程 ，wait 就 会 一 直 
阻塞 在 这 里 ， 直 到 有 一 个 出 现 为 止 ， 函 数 声明 如 下 : 


#include<sys/types.h> 

#include<sys/wait.h> 

pid t wait (int * status); 

子 进 程 的 结束 状态 值 会 由 参数 status 返回 ， 如 果 不 在 意 结束 状态 值 ， 则 参数 status 可 以 设 成 
NULL。 如 果 执 行 成 功 ， 则 返回 子 进程 识别 码 (PID ) ， 如 果 有 错误 发 生 ， 则 返回 -1。 失 败 原 因 存 
于 errno 中 。 

管道 创建 成 功 以 后 ， 创 建 该 管道 的 进程 〈 父 进程 ) 同时 掌握 着 管道 的 读 端 和 写 端 。 下 面 来 看 
一 个 例子 ,实现 父子 进程 间 的 通信 ,这 是 一 个 非常 典型 的 通过 管道 的 进程 通信 的 例子 。 通 常 可 以 采 
用 如 图 6-1 所 示 的 步骤 。 


*: 338* 
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图 6-1 


第 一 步 ， 父 进程 调用 pipe 函数 创建 管道 ， 得 到 两 个 文件 描述 符 fd[0]、fd[1]， 分 别 指向 管道 的 
读 端 和 写 端 。 

第 二 步 ， 父 进程 调用 fork 创建 子 进 程 ， 那 么 子 进程 也 有 两 个 文件 描述 符 指 向 同一 管道 。 

第 三 步 ， 父 进程 关闭 管道 读 端 ， 子 进程 关闭 管道 写 端 。 父 进程 可 以 向 管道 中 写 入 数据 ， 子 进 
程 将 管道 中 的 数据 读 出 。 由 于 管道 是 利用 环形 队列 实现 的 , 因此 数据 从 写 端 流入 管道 , 从 读 端 流出 ， 
这 样 就 实现 了 进程 间 的 通信 。 

下 面 我 们 来 看 一 个 实例 。 
【 例 6.6】 父 子 进程 使 用 管道 通信 

(1) 打开 UE， 输 入 代码 如 下 : 


#include <unistd.h> 
#include <string.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <sys/wait.h> 
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void sys err(const char *str) 
t 

perror(str); 

exit(1); 


int main(void) 


pid t pid; 

char buf[1024]; 

int fd[2]; 

char *p = "test for pipeWMn"; 


if (pipe(fd) == -1)  // 创 建 管道 
sys err("pipe"); 


pid = fork; // 创 建 子 进程 
if (pid « O) ( 
sys err("fork err"); 
) 
else if (pid == 0) ( 
close(fd[1]); // 关 闭 写 描述 符 
printf("child process wait to read: Wn"); 
int len = read(fd[0], buf, sizeof(buf)); // 等 待 管道 上 的 数据 
write(STDOUT FILENO, buf, len); 
close(fd[01]); 
) 
else ( 
close(fd[0]); // 关 闭 读 描 述 符 
write(fd[1], p, strlen(p)); // 向 管道 写 入 字符 串 数据 
wait (NULL); 
close(fd[1]); 
} 


return 0; 


} 

在 代码 中 ， 首 先 创建 一 个 管道 ， 得 到 fd[0] 和 fa[1] 两 个 读 写 描述 符 ， 然 后 用 fork 函数 创建 一 个 
子 进程 ， 在 子 进程 中 ， 先 关闭 写 描述 符 ， 然 后 开始 读 管道 上 的 数据 ， 而 父 进程 中 创建 了 子 进程 后 ， 
就 关闭 读 描述 符 ， 并 向 管道 写 入 字符 串 p. 

(2) 保存 代码 为 test.cpp， 然 后 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

child process wait to read: 

test for pipe 
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[5 6.7] read 阻塞 10 秒 后 读数 据 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <unistd.h> 
#include «stdlib.h» 
#include «fcntl.h» 


int main(void) 
t 
int fds[2]; 
if (pipe(fds) -- -1) ( 
perror("pipe error"); 
exit(EXIT FAILURE); 
) 


pid t pid; 
pid = fork(); 
if (pid == -1) ( 


perror("fork error"); 
exit(EXIT FAILURE); 
) 
if (pid == 0) ( 
close (fds [0] ) ; // 子 进程 关闭 读 端 
sleep (10) ;// 睡 眠 10 秒 
write(fds[1], "hello", 5);// 子 进程 写 数据 给 管道 
exit(EXIT SUCCESS); 
) 


close (fds [1] ) ; // 父 进程 关闭 写 端 

char buf[10] = { 0 }; 

read(fds[0], buf, 10); // 等 待 读数 据 
printf("receive datas = %s\n", buf); 
return 0; 


) 


在 代码 中 ， 我 们 让 子 进程 先 睡眠 10 秒 ， 父 进程 因为 没有 数据 从 管道 中 读 出 ， 被 阻塞 了 ， 直 到 





子 进 程 睡眠 结束 ， 向 管道 中 写 入 数据 后 ， 父 进程 才 读 到 数据 。 
(2) 保存 代码 为 test.cpp， 然 后 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 
[root@localhost test]# g++ test.cpp -o test 


[root@localhost test]# ./test 
receive datas = hello 


可 以 看 到 ， 运 行 test 后 ， 稍 等 10 秒 ， 父 进程 就 会 读 到 数据 了 ， 可 见 read 在 管道 中 没有 数据 可 


读 的 时 候 ， 的 确 阻 塞 了 调用 进程 《这 里 是 父 进 程 ) 。 
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6.2.7 ”使 用 管道 的 特殊 情况 


使 用 管道 需要 注意 以 下 4 种 特殊 情况 (假设 都 是 阻塞 UO 操作 ， 没 有 设置 O0 NONBLOCK fs 
志 ) : 


CD 如 果 所 有 指向 管道 写 端的 文件 描述 符 都 关闭 了 〈 管 道 写 端 引用 计数 为 0) ， 而 仍然 有 进 
程 从 管道 的 读 端 读数 据 , 那么 管道 中 剩余 的 数据 都 被 读 取 后 ， 再 次 read 会 返回 0， 就 像 读 到 文件 末 
尾 一 样 。 

(2) 如 果 有 指向 管道 写 端的 文件 描述 符 没 关 闭 管道 写 端 引用 计数 大 于 0) ， 而 持 有 管道 写 
端的 进程 也 没有 向 管道 中 写 数 据 , 这 时 有 进程 从 管道 读 端 读数 据 , 那么 管道 中 剩余 的 数据 都 被 读 取 
后 ， 再 次 read 会 阻塞 ， 直 到 管道 中 有 数据 可 读 了 才 读 取 数据 并 返回 。 

(3) 如 果 所 有 指向 管道 读 端 的 文件 描述 符 都 关闭 了 管道 读 端 引 用 计数 为 0) ， 这 时 有 进程 
向 管道 的 写 端 write， 那 么 该 进程 会 收 到 信号 SIGPIPE， 通 常会 导致 进程 异常 终止 。 当 然 ， 也 可 以 
对 SIGPIPE 信号 实施 捕捉 ， 不 终止 进程 。 

(4) 如 果 有 指向 管道 读 端的 文件 描述 符 没 关 闭 管道 读 端 引用 计数 大 于 0) ， 而 持 有 管道 读 
端的 进程 也 没有 从 管道 中 读数 据 , 这 时 有 进程 向 管道 写 端 写 数据 , 那么 在 管道 被 写 满 时 , 再 次 write 
会 阻塞 ， 直 到 管道 中 有 空位 置 了 才 写 入 数据 并 返回 。 





6.3 消息 队列 


现在 我 们 来 讨论 另 一 种 常用 的 进程 间 通 信 方 式 : 消息 队列 。 从 许多 方面 来 看 ， 消 息 队 列 类 似 
于 有 名 管道 , 但 是 却 没 有 与 打开 和 关闭 管道 的 复杂 关联 。 然 而, 使 用 消息 队列 并 没有 解决 我 们 使 用 
有 名 管道 所 遇 到 的 问题 ， 例 如 管道 上 的 阻塞 。 

消息 队列 提供 了 一 种 在 两 个 不 相关 的 进程 之 间 传 递 数据 的 简单 高 效 的 方法 。 与 有 名 管道 比较 
起 来 , 消息 队列 的 优点 在 独立 于 发 送 与 接收 进程 , 这 减少 了 在 打开 与 关闭 有 名 管道 之 间 同 步 的 困难 。 

消息 队列 提供 了 一 种 由 一 个 进程 向 另 一 个 进程 发 送 块 数据 的 方法 。 另 外 ， 每 一 个 数据 块 被 看 
作 有 一 个 类 型 ， 而 接收 进程 可 以 独立 接收 具有 不 同类 型 的 数据 块 。 消 息 队 列 的 好 处 在 于 我 们 几乎 可 
以 完全 避免 同步 问题 ， 并 且 可 以 通过 发 送 消息 屏蔽 有 名 管道 的 问题 。 更 好 的 是 ， 我 们 可 以 使 用 某 些 
紧急 方式 发 送 消息 。 坏 处 在 于 ,与 管道 类 似 ， 在 每 一 个 数据 块 上 有 一 个 最 大 尺寸 限制 ， 同 时 在 系统 
中 所 有 消息 队列 的 块 尺寸 上 也 有 一 个 最 大 尺寸 限制 。 

尽管 有 这 些 限制 , 但 是 Linux 并 没有 定义 这 些 限制 的 具体 值 , 除了 指出 超过 这 些 尺 寸 是 某 些 消 
息 队 列 功能 失败 的 原因 。Linux 系统 有 两 个 定义 : MSGMAX 与 MSGMNB， 分 别 用 于 定义 单个 消 
息 与 一 个 队列 的 最 大 尺寸 。 这 些 宏 定义 在 其 他 系统 上 也 许 并 不 相同 ， 甚 至 也 许 就 不 存在 。 

Linux 提供 了 一 组 消息 队列 函数 让 我 们 使 用 消息 队列 ， 消 息 队列 函数 定义 如 下 : 

#include <sys/msg.h> 

int msgctl(int msqid, int cmd, struct msqid ds *buf); 

int msgget(key t key, int msgflg); 

int msgrcv(int msqid, void *msg ptr, size t msg sz, long int msgtype, int 
msgflg); 
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int msgsnd(int msqid, const void *msg ptr, size t msg sz, int msgflg); 

与 信息 号 和 共享 内 存 一 样 ， 头 文件 sys/types.h 与 syslipc.h 通常 也 是 需要 的 。 RARE, FHR 
一 个 一 个 了 解 。 
6.3.1 创建 和 打开 消息 队列 函数 msgget 

函数 msgget 用 于 得 到 一 个 已 存在 的 消息 队列 标识 符 或 创建 一 个 消息 队列 对 象 ， 声 明 如 下 : 





#include <sys/types.h> 

#include <sys/ipc.h> 

#include <sys/msg.h> 

int msgget(key t key, int msgflg); 

其 中 , 参数 key 表示 消息 队列 的 键 值 ( 有 点 类 似 数据 库 表 中 的 键 值 概念 ) ， 用 于 标识 一 个 消息 
队列 , 函数 将 它 与 已 有 的 消息 队列 对 象 的 关键 字 进 行 比较 ,以 此 来 判断 消息 队列 对 象 是 否 已 经 创建 ， 
如 果 取 宏 IPC PRIVATE (数值 为 O 表示 创建 一 个 私有 队列 ， 这 在 理论 上 只 可 以 被 当前 进程 所 访 
W, key t 是 一 个 32 位 整 型 ， 参数 msgflg 表示 创建 或 访问 消息 队列 的 具体 方式 ， 通 常 取 值 如 下 。 

IPC CREAT: 如 果 消 息 队 列 对 象 不 存在 ， 则 创建 消息 队列 对 象 ， 否 则 进行 打开 操作 。 要 创建 
一 个 新 的 消息 队列 , IPC CREAT 特殊 位 必须 与 其 他 的 权限 位 进行 或 操作 。 如 果 消 息 队 列 已 经 存在 ， 
IPC CREAT 标记 只 是 简单 地 被 忽略 。 

IPC EXCL: 和 IPC CREAT 一 起 使 用 (用 “|” 连 接 ) ， 如 果 消息 对 象 不 存在 ， 则 创建 之 ， 
否则 产生 一 个 错误 并 返回 。 

如 果 函 数 执行 成 功 ， 则 返回 一 个 正 数 作为 消息 队列 标识 符 ， 执 行 错 误 返回 -1， 错 误 原因 存 于 





€ EACCES: 指定 的 消息 队列 已 存在 ， 但 调用 进程 没有 权限 访问 它 。 
€ EEXIST: key 指定 的 消息 队列 已 存在 ， 而 msgflg 中 同时 指定 IPC CREAT 和 
IPC_EXCL 标志 。 

€  ENOENT: key 指定 的 消息 队列 不 存在 ， 同 时 msgflg 中 没有 指定 IPC CREAT 标志 。 

€ ENOMEM: 需要 建立 消息 队列 ， 但 内 存 不 足 。 

€ ENOSPC: 需要 建立 消息 队列 ， 但 已 达到 系统 的 限制 。 

大 家 可 以 想 一 下 ， 为 什么 需要 键 值 key? 这 是 因为 是 进程 间 的 通信 ， 所 以 必须 有 一 个 公共 的 标 
识 来 确保 使 用 同一 个 通信 通道 (比如 这 个 通信 通道 就 是 消息 队列 ) ,再 把 这 个 标识 与 某 个 消息 队列 
进行 绑 定 , 任何 一 个 进程 如 果 使 用 同一 个 标识 ， 内 核 就 可 以 通过 该 标识 找到 对 应 的 那个 队列 ， 这 个 
标识 就 是 键 值 。 如 果 没 有 键 值 ， 进 程 A 打开 或 者 创建 一 个 队列 并 返回 这 个 队列 的 描述 符 ， 但 其 他 
进程 不 知道 这 个 队列 的 描述 符 是 什么 ， 因 此 就 不 能 通信 了 。 


6.3.2 ”获取 和 设置 消息 队列 的 属性 函数 msgctl 
函数 msgetl 用 于 获取 和 设置 消息 队列 的 属性 。 该 函数 声明 如 下 : 





#include <sys/types.h> 





Linux C 与 C++ 一 线 开 发 实践 





#include «sys/ipc.h» 
#include <sys/msg.h> 
int msgctl(int msqid, int cmd, struct msqid_ds *buf); 


其 中 ， 参 数 msqid 是 消息 队列 标识 符 ; cmd 表示 要 对 消息 队列 进行 的 操作 ， 它 的 取 值 可 以 是 : 


€ IPC STAT: 读 取 消息 队列 的 msqid_ ds 数据 ， 并 将 其 存储 在 buf 指定 的 地 址 中 。 
IPC SET: 设置 消息 队列 的 属性 ， 要 设置 的 属性 需 先 存储 在 buf 中 ， 可 设置 的 属性 包 
括 : msg perm.uid. msg perm.gid. msg perm.mode 以 及 msg qbytes. 

€ IPC EMID: 将 队列 从 系统 内 核 中 删除 。 


参数 buf 指向 消息 队列 管理 结构 体 msqid_ds， 该 结构 体 定义 如 下 : 


/* Obsolete, used only for backwards compatibility and libc5 compiles */ 
struct msqid ds { 
struct ipc perm msg perm; 
struct msg *msg first; /* first message on queue,unused */ 
struct msg *msg last; /* last message in queue,unused */ 
. kernel time t msg stime; /* last msgsnd time */ 
. kernel time t msg rtime; /* last msgrcv time */ 
kernel time t msg ctime; /* last change time */ 
unsigned long msg lcbytes; /* Reuse junk fields for 32 bit */ 
unsigned long msg lqbytes; /* ditto */ 
unsigned short msg cbytes; /* current number of bytes on queue */ 
unsigned short msg gnum; /* number of messages in queue */ 
unsigned short msg qbytes; /* max number of bytes on queue */ 
. kernel ipc pid t msg lspid;  /* pid of last msgsnd */ 
. kernel ipc pid t msg lrpid;  /* last receive pid */ 
u 


如 果 函 数 执行 成 功 就 返回 0， 失 败 返 回 -1， 错 误 原 因 可 以 通过 错误 码 erno 获得 ， 常 见 错误 码 
如 下 。 


EACCESS: 参数 cmd 为 IPC_STAT， 无 权限 读 取 该 消息 队列 。 
EFAULT: 参数 buf 指向 无 效 的 内 存 地 址 。 

EIDRM: 标识 符 为 msqid 的 消息 队列 已 被 删除 。 

EINVAL: 无 效 的 参数 cmd 或 msqid。 

EPERM: 参数 cmd 为 IPC SET X IPC RMID， 却 无 足够 的 权限 执行 。 


6.3.3 将 消息 送 入 消息 队列 的 函数 msgsnd 
msgsnd 函数 用 来 将 消息 送 入 消息 队列 。 该 函数 声明 如 下 : 


#include <sys/types .h> 

#include <sys/ipc.h> 

#include <sys/msg.h> 

int msgsnd(int msqid, const void *msgp, size_t msgsz, int msgflg); 
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Hp, S% msqid 是 消息 队列 对 象 的 标识 符 〈 由 msgget 函数 得 到 ) ， 第 二 个 参数 msgp 指向 
消息 缓冲 区 的 指针 ， 该 缓冲 区 用 来 暂时 存储 要 发 送 的 消息 ， 通 常 可 用 一 个 通用 结构 来 表示 消息 : 
struct msgbuf ( 
long mtype; /* 消息 类 型 ， 必 须 大 于 0*/ 
char mtext[1]; /* 消 息 数据 */ 
}; 


第 三 个 参数 msgsz 是 要 发 送信 息 的 长 度 〈 字 节 数 ) ， 可 以 用 以 下 公式 计算 : 





msgsz = sizeof(struct mymsgbuf) - sizeof(long); 
第 四 个 参数 msgflg 是 控制 函数 行为 的 标志 ， 可 以 取 以 下 的 值 。 


€ 0: 表示 阻塞 方式 ， 线 程 将 被 阻塞 直到 消息 可 以 被 写 入 。 
€ IPC NOWAIT: 表示 非 阻塞 方式 ， 如 果 消 息 队列 已 满 或 其 他 情况 无 法 送 入 消息 ， 函 
数 立 即 返回 。 


如 果 函 数 执行 成 功 就 返回 0， 失败 返 回 -1，errmo 被 设 为 以 下 某 个 值 。 


© EACCES: 调用 进程 在 消息 队列 上 没有 写 权 限 ， 同 时 没有 CAP_IPC_OWNER 权限 。 
EAGAIN: 由 于 消息 队列 的 msg qbytes 限制 和 msgflg 中 指定 IPC NOWAIT 标志 ， 因 
此 消息 不 能 被 发 送 。 

EFAULT: msgp 指针 指向 的 内 存 空间 不 可 访问 。 

EIDRM: 消息 队列 已 被 删除 。 

EINTR: 等 待 消息 队列 空间 可 用 时 被 信号 中 断 。 

EINVAL: 参数 无 效 。 

ENOMEM: 系统 内 存 不 足 ， 无 法 将 msgp 指向 的 消息 复制 进来 。 


6.3.4 ”从 消息 队列 中 读 取 一 条 新 消息 的 函数 msgrcv 
函数 msgrcv 用 于 从 消息 队列 中 读 出 一 条 新 消息 。 该 函数 声明 如 下 : 


#include <sys/types.h> 
#include <sys/ipc.h> 
#include <sys/msg.h> 
ssize_t msgrcv(int msqid, void *msgp, size t msgsz, long msgtyp,int msgflg); 
其 中 ， 参 数 msqid 表示 消息 队列 的 标识 符 ，msgp 指向 要 读 出 消息 的 缓冲 区 。 通 常 消息 缓冲 区 
结构 为 : 
struct msgbuf ( 
long mtype; /* 消息 类 型 ， 必 须 大 于 0*/ 
char mtext[1]; /* 消息 数据 */ 
Nh 


msgsz 表示 消息 数据 的 长 度 ，msgtyp 表示 从 消息 队列 内 读 取 的 消息 形态 。 如 果 值 为 零 ， 则 表 
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示 消 息 队 列 中 的 所 有 消息 都 会 被 读 取 。 人 参数 msgflg 是 控制 函数 行为 的 标志 ， 可 以 取 以 下 的 值 。 


(1) 0: 表示 阻塞 方式 ， 当 消息 队列 为 空 时 ， 一 直 等 待 。 

(2) IPC NOWAIT: 表示 非 阻 塞 方式 ， 消 息 队列 为 空 时 ， 不 等 待 ， 马 上 返回 -1， 并 设 定 错误 
码 为 ENOMSG。 如 果 函 数 执行 成 功 ，msgrcv 返回 复制 到 mtext 数组 的 实际 字 节 数 ， 若 失败 则 返回 
-1, errno 被 设 为 以 下 的 某 个 值 。 





E2BIG: 消息 文本 长 度 大 于 msgsz， 并 且 msgflg 中 没有 指定 。 
G_NOERROREACCES: 调用 进程 没有 读 权能 ， 同 时 没有 CAP_IPC_OWNER 权能 。 
EAGAIN: 消息 队列 为 空 ， 并且 msgflg 中 没有 指定 IPC NOWAIT. 

EFAULT: msgp 指向 的 空间 不 可 访问 。 

EIDRM: 当 进 程 睡 眠 等 待 接收 消息 时 ， 消 息 已 被 删除 。 

EINTR: 当 进程 睡眠 等 待 接收 消息 时 ， 被 信号 中 断 。 

EINVAL: 参数 无 效 。 

ENOMSG: msgflg 中 指定 了 IPC NOWAIT， 同 时 所 请 求 类 型 的 消息 不 存在 。 


6.3.5 生成 键 值 函数 ftok 
系统 建立 IPC 通信 〈 如 消息 队列 、 共 享 内 存 时 ) 必须 指定 一 个 键 值 。 通 常情 况 下 ， 该 键 值 通 
过 ftok 函数 得 到 。 该 函数 声明 如 下 : 


key t ftok( char * fname, int id ); 


其 中 ， 参 数 fname 是 指定 的 文件 名 ， 这 个 文件 必须 是 存在 的 而 且 可 以 访问 的 。id 是 子 序号 ， 
它 是 一 个 8bit 的 整数 ， 即 范围 是 0~255， 可 以 根据 自己 的 约定 随意 设置 ， 没 有 什么 限制 条 件 。 若 函 
数 执行 成 功 ， 则 会 返回 key t 键 值 ， 否 则 返回 -1。 在 一 般 的 UNIX 中 ， 通 常 是 将 文件 的 索引 节点 取 
出 ， 然 后 在 前 面 加 上 子 序号 就 得 到 key_t 的 值 。 

ftok 根据 路 径 名 提取 文件 信息 ， 再 根据 这 些 文件 信息 及 参数 id 合成 key， 该 路 径 可 以 随便 设置 ， 
该 路 径 是 必须 存在 的 ，ftok 只 是 根据 文件 inode 在 系统 内 的 唯一 性 来 取 一 个 数值 ， 和 文件 的 权限 无 关 。 

在 使 用 ftok0 函 数 时 ， 里 面 有 两 个 参数 ， 即 fname Hid, fname 为 指定 的 文件 名 ， 而 id 为 子 序 
列 号 ， 这 个 函数 的 返回 值 就 是 key, 它 与 指定 的 文件 的 索引 节点 号 和 子 序列 号 id 有 关 ， 这样 就 会 给 
我 们 一 个 误解 ， 即 只 要 文件 的 路 径 、 名 称 和 子 序列 号 不 变 ， 那 么 得 到 的 key 值 永远 就 不 会 变 。 

事实 上 ， 这 种 认识 是 错误 的 ， 想 一 下 ， 假 如 存在 这 样 一 种 情况 : 在 访问 同一 共享 内 存 的 多 个 
进程 先后 调用 ftok0 时 间 段 中 ， 如 果 fname 指向 的 文件 或 者 目录 被 删除 而 且 又 重新 创建 ， 那 么 文件 
系统 会 赋予 这 个 同名 文件 新 的 i 节点 信息 ， 于 是 这 些 进程 调用 的 fiokO 都 能 正常 返回 ， 但 键 值 key 
却 不 一 定 相同 了 。 由 此 可 能 造成 的 后 果 是 ， 原 本 这 些 进 程 意图 访问 一 个 相同 的 共享 内 存 对 象 ， 然 而 
由 于 它们 各 自得 到 的 键 值 不 同 , 实际 上 进程 指向 的 共享 内 存 不 再 一 致 , 如 果 这 些 共 享 内 存 都 得 到 创 
E, 则 在 整个 应 用 运行 的 过 程 中 表面 上 不 会 报 出 任何 错误 , 然而 通过 一 个 共享 内 存 对 象 进行 数据 传 
输 的 目的 将 无 法 实现 。 这 是 一 个 很 重要 的 坑 ， 笔 者 当年 因为 此 问题 而 苦 不 堪 言 ， 希 望 大 家 谨 记 。 

所 以 要 确保 key 值 不 变 ， 要么 确保 ftok0 的 文件 不 被 删除 ， 要 么 不 用 ftok()， 指 定 一 个 固定 的 
key 值 。 
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【 例 6.8】 生 成 一 个 键 值 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <sys/sem.h> 
#include <stdlib.h> 
int main() 
t 
key t semkey; 
if((semkey = ftok("./test", 123))«0) 
t 
printf("ftok failed\n"); 
exit(EXIT FAILURE); 
) 
printf("ftok ok ,semkey = $dWn", semkey); 
return 0; 


} 
代码 很 简单 。 用 当前 路 径 下 的 test 程序 文件 和 123 一 起 生成 一 个 键 值 ， 最 后 打印 出 来 。 
(20. 保存 代码 为 test.cpp， 然 后 上 传 到 Linux， 编 译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
ftok ok ,semkey = 2063635014 


【 例 6.9】 解 开 ftok 产生 键 值 的 内 幕 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <sys/stat.h> 
#include <sys/sem.h> 
int main() 
{ 
char filename[50]; 
struct stat buf; 
int ret; 
strcpy( filename, "./test" ); 
ret = stat( filename, &buf ); 
SEL (Ee tm) 
t 
printf( "stat errorWn" ); 
return -1; 


printf( "the file info: ftok( filename, 0x27 ) = $x, st ino = $x, st dev- 


$xWNn", ftok( filename, 0x27 ), buf.st ino, buf.st dev ); 
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return 0; 


) 


代码 中 , 我 们 首先 生成 一 个 键 值 , 然后 用 获取 文件 信息 的 函数 stat 来 获取 test 程序 的 文件 信息 ， 
最 后 打印 出 键 值 和 文件 tet 的 相关 属性 。 


(2) 保存 代码 为 testcpp， 然 后 上 传 到 Linux， 编 译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 

[rootQlocalhost test]# ./test 

the file info: ftok( filename, 0x27 ) = 27009246, st ino = d359246, st dev- 
fd00 


通过 执行 结果 可 以 看 出 ，ftok 获取 的 键 值 是 由 ftok 函数 的 第 二 个 参数 的 后 8 个 位 、st_dev 的 后 
8 fr. st ino 的 后 16 位 构成 的 。 注 意 ， 它 们 都 是 16 进 制 的 。 
其 中 ，st_dev 是 文件 的 设备 编号 ，st_ino 是 文件 的 节点 信息 ， 它 们 都 定义 在 结构 体 stat 中 : 


struct stat { 
unsigned long st _ dev;// 文 件 的 设备 编号 
unsigned long st ino;// 节 点 
unsigned short st mode; // 文 件 的 类 型 和 存 取 的 权限 
unsigned short st _nlink;// 连 到 该 文件 的 硬 链接 数目 ， 刚 建立 的 文件 值 为 1 
unsigned short st uid; // 用 户 ID 
unsigned short st gid; // 组 ID 
unsigned long st rdev; 
unsigned long st size; 
unsigned long st blksize; 
unsigned long st blocks; 
unsigned long st atime; 
unsigned long st atime nsec; 
unsigned long st mtime; 
unsigned long st mtime nsec; 
unsigned long st ctime; 
unsigned long st ctime nsec; 
unsigned long _ unused4; 
unsigned long _ unused5; 


这 个 结构 体 stat 和 函数 stat 都 在 第 4 章 讲 述 过 了 ， 这 里 不 再 袭 述 。 

前 面 我 们 已 经 了 解 了 消息 队列 的 定义 ， 下 面 看 一 下 是 如 何 实际 工作 的 。 我 们 将 会 编写 两 个 程 
F: test 用 来 接收 ，send 用 来 发 送 。 我 们 会 允许 任意 一 个 程序 创建 消息 队列 ， 但 是 接收 者 在 接收 到 
最 后 一 条 消息 后 删除 消息 队列 。 


【 例 6.10】 消 息 队 列 的 发 送 和 接收 
(1) 首先 创建 接收 程序 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
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#include 
#include 
#include 
#include 
#include 
#include 
#include 


<stdlib.h> 
<string.h> 
<errno.h> 
<unistd.h> 
<sys/types.h> 
<sys/ipc.h> 
<sys/msg.h> 


struct my msg st 


{ 


long int my msg type; 
char some text [BUFSIZ]; 


] 


int main() 


{ 


int running = 1; 
int msgid; 
struct my msg st some data; 


long int msg to receive = 0;// 读 取消 息 队 列 中 的 全 部 消息 


// 创 建 消息 队列 
msgid = msgget((key t)1234,0666|IPC CREAT); 
if(msgid == -1) 


{ 


fprintf(stderr,"msgget failed with error: $dWn", errno); 
exit(EXIT FAILURE); 


) 

// 接 收 消息 队列 中 的 消息 直到 遇 到 一 个 end 消 息 。 最 后 ， 消 息 队 列 被 删除 
while (running) 
© “// 阻 塞 方式 等 待 接收 消息 


if (msgrcv (msgid, (void *)&some data, BUFSIZ, msg to receive, 0) == -1) 


t 


fprintf (stderr, "msgrcv failed with errno: $dWn", errno); 
exit(EXIT FAILURE); 


printf("You wrote: $s", some data.some text); 
if (strncmp (some data.some text,"end",3)==0)// 如 果 收 到 的 是 end， 就 退出 循环 


{ 


} 


running = 0; 


if(msgctl(msgid, IPC RMID，0)==-1) // 删 除 消息 队列 


t 


fprintf (stderr, "msgctl(IPC RMID) failedWn"); 
exit(EXIT FAILURE); 


) 


exit(EXIT SUCCESS); 
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} 


代码 很 简单 ， 接 收 者 使 用 msgget 来 获得 消息 队列 标识 符 ， 并 且 等 待 接收 消息 ， 直 到 接收 到 特 
殊 消息 end。 然 后 它 会 使 用 msgctl 删除 消息 队列 进行 一 些 清 理工 作 。 





(2) 保存 代码 为 testcpp， 然 后 上 传 到 Linux， 编 译 并 运行 : 


[root@localhost test]f g++ test.cpp -o test 
[rootQlocalhost test]# ./test 


此 时 接收 程序 就 处 于 等 待 接收 消息 的 状态 了 。 下 面 我 们 创建 消息 发 送 程序 。 打开 UE， 输 入 代 
码 如 下 : 


#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <string.h> 
#includ <errno.h> 
#include <sys/types.h> 
#include <sys/ipc.h> 
#include <sys/msg.h> 
#define MAX TEXT 512 
struct my msg st 
{ 

long int my msg type; 

char some text [MAX TEXT]; 
J; 


int main() 
t 
int running - 1; 
struct my msg st some data; 
int msgid; 
char buffer[BUFSIZ]; 


msgid = msgget((key t)1234，06661IPC_CRERAT) ; // 用 一 个 整数 作为 键 值 
if (msgid---1) 
t 
fprintf(stderr,"msgget failed with errno: $dMn", errno); 
exit(EXIT FAILURE); 
} 
while (running) 
t 
printf("Enter some text: "); 
fgets(buffer, BUFSIZ, stdin); 
some data.my msg type - 1; 
strcpy(some data.some text, buffer); 
if(msgsnd (msgid, (void *)&some data, MAX TEXT, 0)---1) 
t 
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fprintf (stderr, "msgsnd failedWn"); 
exit(EXIT FAILURE); 
H 
if (strncmp (buffer, "end", 3) == 0) 
t 
running - 0; 
} 
} 
exit(EXIT SUCCESS); 
) 


发 送 者 程序 使 用 msgget 创建 一 个 消息 队列 ， 然 后 使 用 msgsnd 函数 向 队列 中 添加 消息 。 
与 管道 的 程序 不 同 ， 消 息 队 列 的 程序 并 没有 必要 提供 自己 的 同步 机 制 。 这 是 消息 队列 比 起 管 
道 的 一 个 巨大 优点 。 


(3) 保存 代码 为 send.cpp， 上 传 到 Linux， 另 开 一 个 终端 窗口 ， 在 命令 行 下 编译 并 运行 


[root@localhost test]# ./send 
Enter some text: abc 

Enter some text: zww book 
Enter some text: end 


我 们 发 了 3 条 消息 ， 最 后 一 条 是 end。 此 时 接收 端 变 为 : 


[root@localhost test]# ./test 
You wrote: abc 

You wrote: zww book 

You wrote: end 
[root@localhost test]# 


3 条 消息 都 接收 到 了 ， 并 且 收 到 最 后 一 条 程序 就 退出 了 ， 符 合 预期 。 


【 例 6.11】 获 取消 息 队列 的 属性 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <sys/types.h> 
#include <sys/msg.h> 
#include <unistd.h> 
#include <ctime> 
#include "stdio.h" 
#include "errno.h" 
void msg stat(int,struct msqid ds ); 
main() 
t 
int gflags,sflags,rflags; 
key t key; 
int msgid; 
int reval; 
struct msgsbufí 
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int mtype; 
char mtext[1]; 
}msg sbuf; 
struct msgmbuf 
t 
int mtype; 
char mtext[10]; 
)msg rbuf; 
struct msqid ds msg ginfo,msg sinfo; 
char msgpath[]-2"./test"; 


key-ftok (msgpath, 'b'); 
gflags-IPC CREAT|IPC EXCL; 
msgid-msgget (key, g£lags| 00666) ; 
if (msgid---1) 
t 

printf("msg create error\n"); 
) 
// 创 建 一 个 消息 队列 后 ， 输 出 消息 队列 默认 属性 
msg stat(msgid,msg ginfo); 
sflags-IPC NOWAIT; 
msg sbuf.mtype-10; 
msg sbuf.mtext[0]-'a'; 
reval-msgsnd (msgid, &msg sbuf,sizeof(msg sbuf.mtext),sflags); 
if (reval---1) 
{ 

printf ("message send error\n"); 
} 
// 发 送 一 个 消息 后 ， 输 出 消息 队列 属性 


msg stat(msgid,msg ginfo); 


revalemsgctl (msgid, IPC_RMID, NULL) ; // 删 除 消息 队列 
if (reval==-1) 
t 

printf("unlink msg queue errorMn"); 


H 
void msg stat(int msgid,struct msqid ds msg info) 
t 

int reval; 

sleep (1) ; // 只 是 为 了 后 面 输出 时 间 的 方便 

revVal=msgct1l1 (msgid, IPC STAT,&msg info); 

if (reval---1) 

t 

printf("get msg info errorNin"); 

H 

printf ("Nn"); 

printf("current number of bytes on queue is $dWn",msg info.msg cbytes); 
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printf("number of messages in queue is %d\n",msg info.msg qnum); 
printf("max number of bytes on queue is $dWn",msg info.msg qbytes); 
// 每 个 消息 队列 的 容量 〈 字 节 数 ) 都 有 限制 MSGMNB， 值 的 大 小 因 系统 而 异 。 在 创建 新 的 消息 队列 
// 时 ，msg qbytes 的 默认 值 就 是 MSGMNB 
printf("pid of last msgsnd is %d\n",msg info.msg lspid); 
printf("pid of last msgrcv is $dWMn",msg info.msg lrpid); 
printf("last msgsnd time is $s", ctime(&(msg info.msg stime))); 
printf("last msgrcv time is $s", ctime(&(msg info.msg rtime))); 
printf("last change time is $s", ctime(&(msg info.msg ctime))); 
printf("msg uid is $dWMn",msg info.msg perm.uid); 
printf("msg gid is $dWMn",msg info.msg perm.gid); 

) 


其 中 ， 函 数 msg stat 是 一 个 自 定义 函数 ， 用 来 打印 消息 队列 的 一 些 属性 信息 。 我 们 先 创建 了 
一 个 消息 队列 ， 然 后 打印 了 其 属性 信息 ， 接 着 发 送 了 一 个 消息 ， 又 打印 了 其 属性 信息 。 


(2) 保存 代码 为 testcpp， 然 后 上 传 到 Linux， 编 译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootQlocalhost test]# ./test 


current number of bytes on queue is 0 

number of messages in queue is 0 

max number of bytes on queue is 16384 

pid of last msgsnd is 0 

pid of last msgrcv is 0 

last msgsnd time is Thu Jan 1 08:00:00 1970 
last msgrcv time is Thu Jan 1 08:00:00 1970 
last change time is Fri Mar 30 14:55:17 2018 
msg uid is 0 

msg gid is 0 


current number of bytes on queue is 1 

number of messages in queue is 1 

max number of bytes on queue is 16384 

pid of last msgsnd is 90972 

pid of last msgrcv is 0 

last msgsnd time is Fri Mar 30 14:55:18 2018 
last msgrcv time is Thu Jan 1 08:00:00 1970 
last change time is Fri Mar 30 14:55:17 2018 
msg uid is 0 

msg gid is 0 


可 以 看 到 ， 刚 开始 的 时 候 ， 消 息 队 列 里 的 消息 是 0， 发 送 一 个 后 ， 队 列 里 面 的 消息 个 数 就 变 成 
1 了 。 因 为 我 们 发 送 的 消息 是 字符 “a”， 长 度 是 1， 所 以 消息 队列 的 长 度 就 是 一 个 字 节 。 














> 


$78 C++ Web 编 程 


C++ 还 可 以 用 来 开发 Web 程序 ? 你 看 到 这 个 标题 或 许 会 有 一 丝 惊 讶 ，Web 开发 不 是 用 脚本 语 
言 的 吗 ， 比 如 JSP, PHP, ASP.NET 等 。C++ 作 为 编译 语言 也 可 以 用 来 开发 Web 程序 吗 ? 的 确 如 
此 ， 并 且 可 以 做 得 很 好 。 

其 实在 这 些 脚本 语言 诞生 之 前 , Web 开发 就 存在 了 .所 用 的 技术 就 是 赫赫 有 名 的 CGI(Common 
Gateway Interface， 通 用 网 关 接口 ) 。 它 是 Web 开发 的 祖师 和 爷 ， 而 且 只 要 按照 该 接口 的 标准 ， 无 论 
什么 语言 (比如 脚本 语言 Perl， 当 然 也 包括 编译 型 语言 C++) 都 可 以 开发 出 Web 程序 , 也 叫 作 CGI 
程序 。 用 C++ 来 写 CGI 程序 就 好 像 写 普通 程序 一 样 。 其 实 ，C++ 写 Web 程序 虽然 没有 PHP、JSP 
那么 流行 ， 但 在 大 公司 却 很 盛行 ， 比 如 某 公司 的 后 台大 部 分 是 用 C++ 开发 的 ， 该 公司 内 部 C++ 的 
地 位 独一无二 ， 不 仅 逻 辑 层 用 C++ 写 ， 连 大 部 分 Web 程序 都 用 C++ 写 。 

用 C++ 开发 Web 程序 虽然 不 那么 大 众 ， 但 却 像 英菲尼迪 ， 小 众 而 强悍 。 


7.1 CG 程序 的 工作 方式 


我 们 知道 浏览 网 页 其 实 就 是 用 户 的 浏览 器 和 Web 服务 器 进行 交互 的 过 程 。 具 体 地 讲 ， 在 进行 
网 页 浏览 时 ， 通 常 就 是 通过 一 个 URL 请 求 一 个 网 页 ， 然 后 服务 器 返回 这 个 网 页 文件 给 浏览 器 ， 浏 
览 器 在 本 地 解析 该 文件 并 演 染 成 我 们 看 到 的 网 页 , 这 是 静态 网 页 的 情况 .还 有 一 种 情况 是 动态 网 页 ， 
就 是 动态 生成 网 页 ， 也 就 是 说 在 服务 端 没有 这 个 网 页 文件 ， 它 是 在 网 页 请 求 的 时 候 动 态 生成 的 ， 比 
如 PHP/JSP 网 页 (通过 PHP 程序 和 JSP 程序 动态 生成 的 网 页 ) 。 依 据 浏览 器 传 来 的 请 求 参数 的 不 
同 ， 生 成 的 内 容 也 不 同 。 

同样 ,在 浏览 器 向 Web 服务 器 请 求 一 个 后 组 是 cgi 的 URL 或 者 提交 表单 的 时 候 ，Web 服务 器 
会 把 浏览 器 传 来 的 数据 传 给 CGI 程序 ，CGI 程序 通过 标准 输入 来 接收 这 些 数 据 。CGI 程序 处 理 完 
数据 后 ， 通 过 标准 输出 将 结果 信息 发 往 Web 服务 器 ，Web 服务 器 再 将 这 些 信 息 发 送 给 浏览 器 。 





7.2 架设 Web 服务 器 Apache 


我 们 在 开发 CGI 程序 之 前 ， 首 先 需 要 一 个 Web 服务 器 。 因 为 我 们 的 程序 是 运行 在 Web 服务 
器 上 的 。Web 服务 器 软件 比较 多 ， 比 较 著 名 的 有 Apache 和 Nginx。 这 里 选用 Apache。 我 们 不 必 再 
去 下 载 安装 Apache， 因 为 按照 第 2 章 讲述 的 安装 CentOS 7.2 后 ，Apache 已 经 自动 安装 了 。 这 里 可 
以 直接 运行 它 。 首 先 可 以 用 命令 rpm 来 查看 Apache 是 否 安装 : 


[rootelocalhost 桌面 ]# rpm -qa | grep httpd 
httpd-2.4.6-40.e17.centos.x86 64 
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httpd-manual-2.4.6-40.e17.centos.noarch 
httpd-tools-2.4.6-40.e17.centos.x86 64 
httpd-devel-2.4.6-40.e17.centos.x86 64 


上 面 的 结果 表示 Apache 已 经 安装 了 ， 版 本 号 是 2.4.6， 也 可 以 用 httpd -v 来 查看 版 本 号 。httpd 
是 Apache 服务 器 的 主 程序 的 名 字 。 有 些 急性 子 的 朋友 可 能 看 到 Apache 既然 已 经 安装 了 ， 就 迫 不 
及 待 地 打开 浏览 器 ， 在 地 址 栏 里 输入 http:Wlocalhost， 和 希望 能 看 到 结果 。 但 很 遗憾 ， 提 示 无 法 找到 
网 页 。 这 是 因为 Apache 服务 器 虽然 安装 了 ， 但 程序 可 能 还 没 运 行 。 所 以 我 们 先 来 看 一 下 httpd 有 
没有 在 运行 : 

[rootQ@localhost 桌面 ]# pgrep -1 httpd 

[root@localhost 桌面 ]# 


什么 也 没有 输出 ， 说 明 httpd 没有 在 运行 。 其 中 ，pgrep 是 通过 程序 的 名 字 来 查询 进程 的 工具 ， 
一 般 用 来 判断 程序 是 否 正 在 运行 ， 选 项 -1 表示 如 果 运 行 ， 就 将 列 出 进程 名 和 进程 ID。 既 然 没 有 在 
运行 ， 那 我 们 运行 它 : 





[rootQ@localhost 桌面 ]# service httpd start 
Redirecting to /bin/systemctl start httpd.service 


此 时 再 查看 httpd 有 没有 在 运行 : 


[root(localhost rc.d]# pgrep -l httpd 
7037 httpd 

7038 httpd 

7039 httpd 

7040 httpd 

7041 httpd 

7042 httpd 

7043 httpd 

[rootélocalhost rc.d]# 


可 以 看 到 ，httpd 在 运行 了 ， 第 一 列 是 进程 ID 。 这 个 时 候 如 果 在 Centos 7 下 打开 浏览 器 ， 并 
在 地 址 栏 里 输入 http://localhost， 就 可 以 看 到 网 页 了 ， 如 图 7-1 所 示 。 


c Emum- tm- Qe web tree = 


Apache HTTP Server Test Page powered by CentOS ~ Mozilla Firefor 





This page is used to test the proper operation of the Apache HTTP server after it has been 
installed. If you can read this page it means that this site is working properly. This server is 


powered by CentOS. 


Just visiting? Are you the Administrator? 


Ya add ys ente 






The website you just visited is either experiencing 
problems or is undergoing routine maintenance. 





that youve seen 





tthe admi 








图 7-1 
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至 此 ，Apache Web 服务 器 架设 成 功 了 。 但 要 让 CGI 程序 能 正常 运作 ， 还 必须 配置 Apache, 
使 其 允许 执行 CGI 程序 。 再 次 强调 ， 是 Web 服务 器 进程 来 执行 CGI 程序 。 首 先 打开 Apache 的 配 
置 文件 : 

gedit /etc/httpd/conf/httpd.conf 

在 该 配置 文件 中 ,我 们 搜索 一 下 ScriptAlias, 找到 后 , 确保 它 前 面 没 有 #(# 表 示 注 释 )。ScriptAlias 
是 指令 ， 告 诉 Apache 默认 的 cgi-bin 路 径 。cgi-bin 路 径 就 是 默认 寻找 CGI 程序 的 地 方 ，Apache 会 
到 这 个 路 径 中 去 找 CGI 程序 并 执行 。 接 着 ， 再 次 搜索 AddHandler， 找 到 后 把 它 前 面 的 # 去 掉 ， 该 指 
令 告诉 Apache，CGI 程序 会 有 哪些 后 级 ， 这 里 就 以 默认 值 “.cgi” 作 为 后 级 。 保 存 文件 并 退出 。 最 
后 重启 Apache。 


[root@localhost 桌面 ]# service httpd restart 
Redirecting to /bin/systemctl restart httpd.service 


下 面 我 们 来 看 C++ 开发 的 Web 程序 ， 当 然 很 简单 ， 属 于 Hello World 级 别 的 。 
【 例 7.1】 第 一 个 C++ 开发 的 Web 程序 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 


int main() 

t 
printf("Content-Type: text/htmlWinWin"); 
printf("Hello cgi!Nn"); 
return 0; 


) 
代码 很 简单 ， 只 有 两 个 printf 打印 语句 。 
(20 保存 为 testcpp， 然 后 上 传 到 Linux， 在 命令 下 编译 生成 test， 并 复制 到 /var/www/cgi-bin/。 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# cp test /var/www/cgi-bin/test.cgi 


G) 在 CentOS 7 下 打开 火狐 浏览 器 ， 输 入 网 址 “http:Wlocalhostcgi-bin/testcgi”， 按 回 车 键 ， 
可 以 看 到 如 图 7-2 所 示 的 页 面 。 


Mozilla Firefox 


http;/local ;bin/test.cgi ]x | 


€ | localhost/cgi-b 


Hello World! 
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【 例 7.2】 第 二 个 C++ 开发 的 Web 程序 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main() 


t 
cout 
cout 
cout 
cout 
cout 
cout 
cout 
cout 
cout 


«« 
«« 
«« 
«« 
«« 
«« 
«« 
«« 
«« 


"Content-Type: text/htmlWinWAn"; // 注 意 结尾 是 两 个 \n 
"<html>\n"; 

"<head>\n"; 

"<title>Hello World - First CGI Program</title>\n"; 
"</head>\n"; 

"<body>\n"; 

"<h2>Hello World! This is my first CGI program</h2>\n"; 
"</body>\n"; 

"</html>\n"; 


return 0; 


) 





(20 保存 为 testcpp， 然 后 上 传 到 Linux， 在 命令 下 编译 生成 test， 并 复制 到 /var/www/cgi-bin/。 


[rootélocalhost test]# g++ test.cpp -o test 
[rootelocalhost test]# cp test /var/www/cgi-bin/test.cgi 


(3) 在 CentOS 7 下 打开 火狐 浏览 器 ， 输 入 网 址 “http://localhost/cgi-bin/test.cgi”， 按 回 车 键 ， 
可 以 看 到 如 图 7-3 所 示 的 页 面 。 





Hello World - First CGI Program - Mozilla Firefox — - 
Hello World - First CG. x | 中 


€ | localhost/cgi-bin/test.cgi 


Hello World! This is my first CGI program 





图 7-3 


$08 多 线程 基本 编程 


在 多 核 时 代 ， 如 何 充分 利用 每 个 CPU 内 核 是 一 个 绕 不 开 的 话题 ， 从 需要 为 成 千 上 万 的 用 户 
同时 提供 服务 的 服务 端 应 用 程序 ， 到 需要 同时 打开 十 几 个 页 面 , 每 个 页 面 都 有 几 十 、 上 百 个 链接 的 
Web 浏览 器 应 用 程序 ， 从 需要 支持 并 发 访问 的 数据 库 系 统 ， 到 手机 上 的 一 个 有 良好 用 户 响应 能 力 
的 App， 为 了 充分 利用 每 个 CPU 内 核 ， 都 会 想到 是 否 可 以 使 用 多 线程 技术 。 这 里 所 说 的 “充分 利 
用 ”包含 两 个 层面 的 意思 ， 一 个 是 使 用 到 所 有 的 内 核 ， 另 一 个 是 内 核 不 空 凋 ， 不 让 某 个 内 核 长 时 间 
处 于 空闲 状态 。 在 C++98 的 时 代 ，C++ 标 准 并 没有 包含 多 线程 的 支持 ， 人 们 只 能 直接 调用 操作 系 
统 提供 的 SDK API 来 编写 多 线程 程序 , 不 同 的 操作 系统 提供 的 SDK API 以 及 线程 控制 能 力 不 尽 
相同 ， 到 了 C++11， 终 于 在 标准 之 中 加 入 了 正式 的 多 线程 的 支持 ， 从 而 我 们 可 以 使 用 标准 形式 的 
类 来 创建 与 执行 线程 ， 也 使 得 我 们 可 以 使 用 标准 形式 的 锁 、 原 子 操作 、 线 程 本 地 存储 〈TLS) 等 来 
进行 复杂 的 各 种 模式 的 多 线程 编程 ， 而 且 C++11 还 提供 了 一 些 高 级 概念 ， 比 如 promise/future、 
packaged task. async 等 ， 以 简化 某 些 模式 的 多 线程 编程 。 

多 线程 可 以 让 我 们 的 应 用 程序 拥有 更 加 出 色 的 性 能 ， 同 时 ， 如 果 没 有 用 好 ， 多 线程 又 是 比较 
容易 出 错 的 且 难 以 查找 错误 所 在 ， 甚 至 可 以 让 人 们 觉得 自己 陷 进 了 泥潭 。 作 为 一 名 C++ 程序 员 ， 
掌握 好 多 线程 并 发 开发 技术 是 学 习 的 重 中 之 重 。 而 且 为 了 能 在 实践 工作 中 承接 老 代码 系统 的 维护 ， 
学 习 C++11 之 前 的 多 线程 开发 技术 也 是 必 不 可 少 的 ， 而 以 后 开发 新 功能 ，C++11 将 是 大 势 所 趋 。 
其 实 很 多 原理 都 是 类 似 的 ， 相 信 大 家 学 的 时 候 会 感受 到 这 一 点 。 





8.1 使 用 多 线程 的 好 处 


多 线程 编程 技术 作为 现代 软件 开发 的 流行 技术 ， 恰 当 、 正 确 地 使 用 它 将 会 带 来 巨大 的 优势 。 


(1) 让 软件 拥有 灵敏 的 响应 

在 单线 程 软件 中 ， 当 软件 中 有 多 个 任务 时 ， 比 如 读 写 文件 、 更 新 用 户 界 面 、 网 络 连接 、 打 印 
文档 等 操作 ， 如 果 按 照 先 后 次 序 执行 ， 即 先 完成 前 面 的 任务 再 执行 后 面 的 任务 ， 当 某 个 任务 执行 的 
计 间 较 长 时 ， 比 如 读 写 一 个 大 文件 ， 那 么 用 户 界面 也 无 法 及 时 更 新 ， 这 样 看 起 来 软件 像 死 掉 一 样 ， 
用 户 体验 很 不 好 。 怎么 解决 这 个 问题 呢 ? 人 们 提出 了 多 线程 编程 技术 。 在 采用 多 线程 编程 技术 的 程 
序 中 ,多 个 任务 由 不 同 的 线程 去 执行 , 不同 线程 各 自 占用 一 段 CPU 时 间 ， 即 使 线程 任务 还 没完 成 ， 
也 会 让 出 CPU 时 间 给 其 他 线程 有 机 会 去 执行 。 这 样 从 用 户 的 角度 看 起 来 , 好 像 几 个 任务 同时 进行 ， 
至 少 界面 上 能 得 到 及 时 更 新 ， 大 大 改善 了 用 户 对 软件 的 体验 ， 提 高 了 软件 的 响应 速度 和 友好 度 。 
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(2) 充分 利用 多 核 处 理 器 

随 着 多 核 处 理 器 日 益 普 及 ， 单 线程 程序 人 印发 成 为 性 能 瓶颈 。 比 如 计算 机 有 2 CPU 核 ， 单 线 
程 软件 同一 时 刻 只 能 让 一 个 线程 在 一 个 CPU 核 上 运行 ， 另 一 个 核 就 可 能 空闲 在 那里 ， 无 法 发 挥 性 
能 。 如 果 软 件 设 计 了 2 个 线程 ， 则 同一 时 刻 可 以 让 这 两 个 线程 在 不 同 的 CPU 核 上 同时 运行 ， 运 行 
效率 增加 一 倍 。 


(3) 更 高 效 的 通信 
对 于 同一 进程 的 线程 来 说 ， 它 们 共享 该 进程 的 地 址 空间 ， 可 以 访问 相同 的 数据 。 通 过 数据 共 
享 的 方式 使 得 线程 之 间 的 通信 比 进程 之 间 的 通信 更 高 效 和 方便 。 


(4) 开销 比 进程 小 

创建 线程 、 线 程 切换 等 操作 所 带 来 的 系统 开销 比 进程 的 类 似 操作 所 需 开 销 要 小 得 多 。 由 于 线 
程 共享 进程 资源 ,因此 创建 线程 时 不 需要 再 为 其 分 配 内 存 空 间 等 资源 ,因此 创建 时 间 也 更 短 。 比 如 
在 Solaris 2 操作 系统 上 ， 创 建 进程 的 时 间 大 约 是 创建 线程 的 30 倍 。 线 程 作为 基本 执行 单元 ， 当 从 
同一 个 进程 的 某 个 线程 切换 到 另 一 个 线程 时 , 需要 载 入 的 信息 比 进程 之 间 切 换 要 少 , 所 以 切换 速度 
快 ， 比 如 Solaris 2 操作 系统 中 ， 线 程 的 切换 比 进程 切换 快 大 约 5 倍 。 








8.2 ”多 线程 编程 的 基本 概念 


8.2.1 操作 系统 和 多 线程 


要 在 应 用 程序 中 实现 多 线程 ， 必 须要 有 操作 系统 的 支持 。Linux 32 位 或 64 位 操作 系统 对 应 用 
程序 提供 了 多 线程 的 支持 ， 所 以 Windows NT/2000/XP/7/8/10 是 多 线程 操作 系统 。 根 据 进程 与 线程 
的 支持 情况 ， 可 以 把 操作 系统 大 致 分 为 如 下 几 类 : 


(1) 单 进程 、 单 线程 ，MS-DOS 大 致 是 这 种 操作 系统 。 

(2) 多 进程 、 单 线程 ， 多 数 UNIX (及 类 UNIX 的 Linux) 是 这 种 操作 系统 。 

(3) 多 进程 、 多 线程 ，Win32 CWindows NT/2000/XP/7/8/10 等 ) 、Solaris 2.x 和 OS/2 都 是 这 
种 操作 系统 。 

(4) 单 进程 、 多 线程 ，VxWorks 是 这 种 操作 系统 。 


具体 到 Linux C+ 的 开发 环境 , 它 提供 了 一 套 POSIX API 函数 来 管理 线程 , 用 户 既 可 以 直接 使 
用 这 些 POSIX API 函数 ， 也 可 以 使 用 C++ 自 带 的 线程 类 。 作 为 一 名 Linux C++ 开发 者 ， 这 两 者 都 应 
该 会 使 用 ， 因 为 在 Linux C++ 程序 中 ， 这 两 种 方式 都 有 可 能 会 出 现 。 


8.22 ”线程 的 基本 概念 


现代 操作 系统 大 多 支持 多 线程 概念 ， 每 个 进程 中 至 少 有 一 个 线程 ， 所 以 即使 没有 使 用 多 线程 
编程 技术 ， 进 程 也 含有 一 个 主线 程 ， 所 以 也 可 以 说 ，CPU 中 执行 的 是 线程 ， 线 程 是 程序 的 最 小 执 
行 单位 ， 是 操作 系统 分 配 CPU 时 间 的 最 小 实体 。 一 个 进程 的 执行 说 到 底 是 从 主线 程 开始 的 ， 如 果 
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需要 ， 可 以 在 程序 任何 地 方 开辟 新 的 线程 ， 其 他 线程 都 是 由 主线 程 创建 的 。 一 个 进程 正在 运行 ， 也 
可 以 说 是 一 个 进程 中 的 某 个 线程 正在 运行 。 一 个 进程 的 所 有 线程 共享 该 进程 的 公共 资源 , 比如 虚拟 
地 址 空间 、 全 局 变量 等 。 每 个 线程 也 可 以 拥有 自己 私有 的 资源 ， 如 堆栈 、 在 堆栈 中 定义 的 静态 变量 
和 动态 变量 、CPU 寄存 器 的 状态 等 。 

线程 总 是 在 某 个 进程 环境 中 创建 的 ， 并 且 会 在 这 个 进程 内 部 销毁 。 线 程 和 进程 的 关系 是 : 线 
程 是 属于 进程 的 , 线程 运行 在 进程 空间 内 ,同一 进程 所 产生 的 线程 共享 同一 内 存 空间 ， 当 进程 退出 
Wr, 该 进程 所 产生 的 线程 都 会 被 强制 退出 并 清除 。 线程 可 与 属于 同一 进程 的 其 他 线程 共享 进程 所 拥 
有 的 全 部 资源 , 但 是 其 本 身 基本 上 不 拥有 系统 资源 ， 只 拥有 一 点 在 运行 中 必 不 可 少 的 信息 (如 程序 
计数 器 、 一 组 寄存 器 和 线程 栈 ， 线 程 栈 用 于 维护 线程 在 执行 代码 时 需要 的 所 有 函数 参数 和 局 部 变 
量 ) 。 

相对 于 进程 来 说 ， 线 程 所 占用 的 资源 更 少 ， 比 如 创建 进程 ， 系 统 要 为 它 分 配 很 大 的 私有 空间 ， 
占用 的 资源 较 多 , 而 对 于 多 线程 程序 来 说 ， 由 于 多 个 线程 共享 一 个 进程 地 址 空间 ,因此 占用 的 资源 
较 少 。 此外， 进程 间 切 换 时 ， 需 要 交换 整个 地 址 空间 ， 而 线程 之 间 切 换 时 ， 只 是 切换 线程 的 上 下 文 
环境 ， 因 此 效率 更 高 。 在 操作 系统 中 引入 线程 带 来 的 主要 好 处 是 


(1) 在 进程 内 创建 、 终 止 线程 比 创建 、 终 止 进程 要 快 。 

(2) 同一 进程 内 线程 间 的 切换 比 进程 间 的 切换 要 快 ， 尤 其 是 用 户 级 线程 间 的 切换 。 

(3) 每 个 进程 具有 独立 的 地 址 空间 ， 而 该 进程 内 的 所 有 线程 共享 该 地 址 空间 ， 因 此 线程 的 出 
现 可 以 解决 父子 进程 模型 中 子 进 程 必须 复制 父 进程 地 址 空间 的 问题 。 

(4). 线程 对 解决 客户 /服务 器 模型 非常 有 效 。 


虽然 多 线程 给 应 用 开发 带 来 了 不 少 好 处 ， 但 并 不 是 所 有 情况 下 都 要 去 使 用 多 线程 ， 要 具体 问 
题 具体 分 析 ， 通 常 在 下 列 情况 下 可 以 考虑 使 用 : 


(1) 应 用 程序 中 的 各 任务 相对 独立 。 
(2) 某 些 任务 耗 时 较 多 。 

(3) 各 任务 有 不 同 的 优先 级 。 

(4) 一 些 实时 系统 应 用 。 


值得 注意 的 是 ,一 个 进程 中 的 所 有 线程 共享 它们 父 进程 的 变量 , 但 同时 每 个 线程 可 以 拥有 自己 
的 变量 。 
8.2.3 ”线程 的 状态 

一 个 线程 从 创建 到 结束 是 一 个 生命 周期 ， 总 是 处 于 下 面 4 个 状态 中 的 一 个 。 


(1) 就 绪 态 

线程 能 够 运行 的 条 件 已 经 满足 ， 只 是 在 等 待 处 理 器 (处 理 器 要 根据 调度 策略 来 把 就 绪 态 的 线 
程 调度 到 处 理 器 中 运行 ) 。 处 于 就 绪 态 的 原因 可 能 是 线程 刚刚 被 创建 〈 刚 创建 的 线程 不 一 定 马 上 运 
行 , 一 般 先 处 于 就 绪 态 ) ， 可 能 是 刚刚 从 阻塞 状态 中 恢复 , 也 可 能 是 被 其 他 线程 抢占 而 处 于 就 绪 态 。 


* 360* 
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(2) 运行 态 
运行 态 表示 线程 正在 处 理 器 中 运行 ， 正 占用 着 处 理 器 。 
(3) 阻塞 态 


由 于 在 等 待 处 理 器 之 外 的 其 他 条 件 而 无 法 运行 的 状态 叫 作 阻塞 态 。 这 里 的 其 他 条 件 包 括 IO 操 
作 、 互 斥 锁 的 释放 、 条 件 变量 的 改变 等 。 


(4) 终止 态 

终止 态 就 是 线程 的 线程 函数 运行 结束 或 被 其 他 线程 取消 后 处 于 的 状态 。 处 于 终止 态 的 线程 虽 
然 已 经 结束 了 , 但 其 所 占 资源 还 没有 被 回收 ,而且 还 可 以 被 重新 复活 。 我 们 不 应 该 长 时 间 让 线程 处 
于 这 种 状态 。 线 程 处 于 终止 态 后 应 该 及 时 进行 资源 回收 ， 下 面 会 讲 到 如 何 回收 。 


8.24 ”线程 函数 

线程 函数 就 是 线程 创建 后 进入 运行 态 后 要 执行 的 函数 。 执 行 线程 ， 说 到 底 就 是 执行 线程 函数 。 
这 个 函数 是 我 们 自 定义 的 ， 然 后 在 创建 线程 时 把 我 们 的 函数 作为 参数 传 入 线程 创建 函数 。 

同 理 ， 中 断 线程 的 执行 就 是 中 断 线程 函数 的 执行 ， 以 后 再 恢复 线程 的 时 候 ， 就 会 在 前 面 线程 
函数 暂停 的 地 方 开始 继续 执行 下 面 的 代码 。 结 束 线程 也 就 不 再 运行 线程 函数 。 线 程 的 函数 可 以 是 一 
个 全 局 函数 或 类 的 静态 函数 ， 比 如 在 POSIX 线程 库 中 ， 它 通常 这 样 声明 : 


void *ThreadProc (void *arg): 


其 中 ,参数 arg 指向 要 传 给 线程 的 数据 ， 这 个 参数 是 在 创建 线程 的 时 候 作 为 参数 传 入 线程 创建 
函数 中 的 。 函 数 的 返回 值 应 该 表示 线程 函数 运行 的 结果 : 成 功 还 是 失败 。 注 意 函 数 名 ThreadProc 
可 以 是 自 定义 的 函数 名 ， 这 个 函数 是 用 户 自己 先 定义 好 ， 然 后 由 系统 来 调用 。 


8.2.5 ”线程 标识 


既然 句柄 是 用 来 标识 线程 对 象 的 ， 那 线程 本 身 用 什么 来 标识 呢 ? 在 创建 线程 的 时 候 ， 系 统 会 
为 线程 分 配 一 个 唯一 的 ID 作为 线程 的 标识 ， 这 个 ID 号 从 线程 创建 开始 存在 ， 一 直 伴随 着 线程 的 
结束 才 消 失 。 线 程 结 束 后 ， 该 ID 就 自动 不 存在 ， 我 们 不 需要 去 显 式 清除 它 。 

通常 线程 创建 成 功 后 会 返回 一 个 线程 ID。 


8.26 C++ 多 线程 开发 的 两 种 方式 


在 Linux C++ 开发 环境 中 , 通常 有 两 种 方式 来 开发 多 线程 程序 , 一 种 是 利用 POSIX 多 线程 API 
函数 来 开发 多 线程 程序 ， 另 一 种 是 利用 C++ 自 带 线 程 类 来 开发 多 线程 程序 。 这 两 种 方式 各 有 利弊 。 
前 一 种 方法 比较 传统 , 后 一 种 方法 比较 新 , 是 C++11 推出 的 方法 ,为何 C++ 程序 员 也 要 熟悉 POSIX 
多 线程 开发 呢 ? 这 是 因为 CH1 以 前 ，C++ 里 面 使 用 多 线程 一 般 都 是 利用 POSIX 多 线程 API， 或 
者 把 POSIX 多 线程 API 封装 成 类 , 再 在 公司 内 部 供 大 家 使 用 ,所 以 一 些 老 项 目 都 是 和 POSIX 多 线 
程 库 相 关 的 ， 这 也 使 得 我 们 必须 熟悉 它 ， 因 为 很 可 能 进入 公司 后 会 要 求 维护 以 前 的 程序 代码 。 而 
C++ 自 带 线程 类 很 可 能 在 以 后 开发 新 的 项 目 时 会 用 到 。 总 之 ， 技 多 不 压 身 。 
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8.3 利用 POSIX 多 线程 API 函数 进行 多 线程 开发 


在 用 POSIX 多 线程 API 线程 函数 进行 开发 之 前 ， 我 们 首先 要 熟悉 这 些 API 函数 。 常 见 的 与 线 
程 有 关 的 基本 API 函数 如 表 8-1 所 示 。 





表 8-1 与 线程 有 关 的 基本 API 函数 


在 线 种 数 中 调用 米 过 出 线程 要 
向 线程 发 送 一 个 信号 

使 用 这 些 API 函数 需要 包含 头 文件 pthread.h， 并 且 在 编译 的 时 候 需要 加 上 库 pthread， 表 示 包 
含 多 线程 库 文件 。 





8.3.1 线程 的 创建 
在 POSIX API 中 ， 创 建 线 程 的 函数 是 pthread_create， 该 函数 声明 如 下 : 


int pthread create(pthread t *pid, const pthread attr t *attr,void 
*(*start routine) (void *),void *arg); 


其 中 ,参数 pid 是 一 个 指针 , 指向 创建 成 功 后 的 线程 的 ID, pthread. t 其 实 就 是 unsigned long int; 
attr 是 指向 线程 属性 结构 pthread_attr t 的 指针 ， 如 果 为 NULL， 则 使 用 默认 属性 ;start_routine 指向 
线程 函数 的 地 址 ， 线 程 函数 就 是 线程 创建 后 要 执行 的 函数 ，arg 指向 传 给 线程 函数 的 参数 ， 如 果 执 
行 成 功 ， 函 数 返 回 0 。 

CreateThread 创建 完 子 线程 后 ， 主 线程 会 继续 执行 CreateThread 后 面 的 代码 ， 这 就 可 能 会 出 现 
创建 的 子 线程 还 没 执行 完 ， 主 线程 就 结束 了 ， 比 如 控制 台 程 序 ， 主 线程 结束 就 意味 着 进程 结束 了 。 
在 这 种 情况 下 , 我 们 就 需要 让 主线 程 等 待 ,等 待 子 线程 全 部 运行 结束 后 再 继续 执行 主线 程 。 还 有 一 
种 情况 , 主线 程 为 了 统计 各 个 子 线程 工作 的 结果 而 需要 等 待 子 线程 结束 后 再 继续 执行 此 时 主线 程 
就 要 等 待 了 。POSIX 提供 了 函数 pthread_join 来 等 待 子 线程 结束 , 即 子 线程 的 线程 函数 执行 完毕 后 ， 
pthread join 才 返 回 ， 因 此 pthread join 是 一 个 阻塞 函数 。 函 数 pthread join 会 让 主线 程 挂 起 (休眠 ， 
就 是 让 出 CPU) ， 直 到 子 线程 都 退出 ， 同 时 pthread join 能 让 子 线程 所 占 资 源 得 到 释放 。 子 线程 退 
出 后 ， 主 线程 会 接收 到 系统 的 信号 ， 从 休眠 中 恢复 。 函 数 pthread join 声明 如 下 : 








int pthread join(pthread t pid, void **value ptr); 


其 中 ， 参 数 pid 是 所 等 待 线程 的 ID 号 ; value_ptr 通常 可 设 为 NULL, WRF NULL, W 
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pthread join 复制 一 份 线程 退出 值 到 一 个 内 存 区 域 ， 并 让 *value_ptr 指向 该 内 存 区域 ， 因 此 
pthread join 还 有 一 个 重要 功能 就 是 能 获得 子 线程 的 返回 值 〈 这 一 点 后 面 会 讲 到 ) 。 如 果 函 数 执行 


成 功 就 返回 0， 否则 返回 错误 码 。 
下 面 来 实践 一 下 ， 看 几 个 简单 的 例子 。 
【 例 8.1】 创 建 一 个 简单 的 线程 ， 不 传 参数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 





#include «pthread.h» 
#include «stdio.h» 
#include <unistd.h> //sleep 


void *thfunc (void *arg) // 线 程 函数 
{ 


printf("in thfunc\n"); 
return (void *)0; 


int main(int argc, char *argv []) 


pthread t tidp; 
int ret; 


ret = pthread create(&tidp, NULL, thfunc, NULL); // 创 建 线程 
if (ret) 
t 

printf("pthread create failed:$dWn", ret); 

return -1; 


) 
sleep(1); //main 线 程 挂 起 1 秒 钟 ， 为 了 让 子 线程 有 机 会 执行 


printf("in main:thread is created\n"); 


return 0; 
} 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -Ipthread" , 


是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结 果 如 下 : 


[root@localhost test]# g++ -o test test.cpp -lpthread 
[rootélocalhost test]# ./test 

in thfunc 

in main:thread is created 

[rootQlocalhost test]# 


其 中 pthread 


在 这 个 例子 中 ， 首 先 创建 一 个 线程 ， 在 线程 函数 中 打印 一 行 字符 串 后 结束 ， 而 主线 程 在 创建 子 
线程 后 ， 会 等 待 一 秒 ， 这 样 不 至 于 因为 主线 程 过 早 结束 而 导致 进程 结束 ， 进 程 结 束 后 ， 子 线程 就 没 
有 机 会 执行 了 。 如 果 没有 等 待 函 数 sleep， 则 可 能 子 线程 的 线程 函数 还 没 来 得 及 执行 ， 主 线程 就 结束 
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了 ， 这 样 导致 子 线程 的 线程 函数 都 没有 机 会 执行 ， 因 为 主线 程 已 经 结束 ， 整 个 应 用 程序 已 经 退出 了 。 
【 例 8.2】 创 建 一 个 线程 ， 并 传 入 整 型 参数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 





#include <pthread.h> 
#include <stdio.h> 


void *thfunc (void *arg) 
{ 
int *pn = (int*) (arg); // 获 取 参 数 的 地 址 


int n = *pn; 


printf("in thfunc:n-$dWMn", n); 
return (void *)0; 
) 
int main(int argc, char *argv []) 
t 
pthread t tidp; 
int ret, n-110; 


ret = pthread create(&tidp，NULL，thfunc，&n) ;// 创 建 线程 并 传递 n 的 地 址 
if (ret) 
t 

printf("pthread create failed:$dWn", ret); 

return -1; 


) 


pthread join(tidp,NULL); // 等 待 子 线程 结束 
printf("in main:thread is created\n"); 


return 0; 

(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost test]# g++ -o test test.cpp -lpthread 

[rootélocalhost test]# ./test 

in thfunc:n-110 

in main:thread is created 

[rootélocalhost test]# 

这 个 例子 和 上 面 的 例子 有 两 点 不 同 , 一 是 创建 线程 的 时 候 , 把 一 个 整 型 变量 的 地 址 作为 参数 传 
给 线程 函数 ， 二 是 等 待 子 线程 结束 没有 用 sleep 函数 ， 而 是 用 pthread join 函数 ，sleep 只 是 等 待 一 
个 固定 的 时 间 , 有 可 能 在 这 个 固定 的 时 间 内 子 线程 早已 经 结束 , 或 者 子 线程 运行 的 时 间 大 于 这 个 固 
定时 间 ， 因 此 用 它 来 等 待 子 线程 结束 并 不 精确 ， 而 用 函数 pthread join 则 会 一 直 等 到 子 线程 结束 后 
才 执 行 该 函数 后 面 的 代码 ， 我 们 可 以 看 到 它 的 第 一 个 参数 是 子 线程 的 ID。 
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【 例 8.3】 创 建 一 个 线程 ， 并 传递 字符 串 作 为 参数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <pthread.h> 
#include <stdio.h> 


void *thfunc (void *arg) 


{ 


char *str; 


str = (char *)arg; // 得 到 传 进来 的 字符 串 
printf("in thfunc:str-$sWn", str); // 打 印字 符 串 
return (void *)0; 


int main(int argc, char *argv []) 


pthread t tidp; 
int ret; 
const char *str - "hello world"; 


ret = pthread create(&tidp, NULL, thfunc, (void *) str);// 创 建 线程 并 传递 str 
if (ret) 
{ 
printf("pthread create failed:%d\n", ret); 
return -1; 
) 
pthread join(tidp, NULL); // 等 待 子 线程 结束 
printf("in main:thread is created\n"); 


return 0; 


) 

(2) Lf test.cpp $ Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost test]# g++ -o test test .cpP -lpthread 

[rootélocalhost test]# ./test 

in thfunc:n-110,str-hello world 


in main:thread is created 
[rootélocalhost test]# 


【 例 8.4】 创 建 一 个 线程 ， 并 传递 结构 体 作为 参数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include «pthread.h» 
#include <stdio.h> 


typedef struct // 定 义 结构 体 的 类 型 
{ 
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int n; 
char *str; 
)MYSTRUCT; 
void *thfunc(void *arg) 
t 
MYSTRUCT *p - (MYSTRUCT*)arg; 
printf("in thfunc:n-$d,str-$s Wn", p-»n,p-»str); // 打 印 结构 体 的 内 容 
return (void *)0; 


int main(int argc, char *argv []) 


pthread t tidp; 

int ret; 

MYSTRUCT mystruct; // 定 义 结构 体 
// 初 始 化 结构 体 

mystruct.n = 110; 
mystruct.str = "hello world"; 


ret = pthread create(&tidp, NULL, thfunc, (void *)&mystruct); 
// 创 建 线程 并 传递 结构 体 地 址 
if (ret) 
{ 
printf("pthread create failed:%d\n", ret); 
return -1; 
) 
pthread join(tidp, NULL); // 等 待 子 线程 结束 
printf("in main:thread is created\n"); 


return 0; 


) 


(2) Lf test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

-bash-4.2# g++ -o test test.cpp -lpthread 

-bash-4.24$ ./test 

in thfunc:n-110,str-hello world 


in main:thread is created 
-bash-4.24 


【 例 8.5】 创 建 一 个 线程 ， 共 享 进程 数据 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <pthread.h> 
#include <stdio.h> 


int gn = 10; // 定 义 一 个 全 局 变量 ， 将 会 在 主线 程 和 子 线程 中 用 到 


void *thfunc(void *arg) 
t 
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gn++; ”// 递 增 1 
printf("in thfunc:gn-$d, n", gn); // 打 印 全 局 变量 gn 值 
return (void *)0; 


int main(int argc, char *argv []) 


pthread t tidp; 
int ret; 


ret - pthread create(&tidp, NULL, thfunc, NULL); 

if (ret) 

( 
printf("pthread create failed:$dWn", ret); 
return -1; 

) 

pthread join(tidp, NULL); // 等 待 子 线程 结束 

gn++; // 子 线程 结束 后 ，gn 再 递增 1 

printf("in main:gn=%d\n", gn); // 再 次 打印 全 局 变量 gn 值 


return 0; 
) 
(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结 果 如 下 : 
-bash-4.24 g++ -o test test.cpp -lpthread 
-bash-4.24 ./test 
in thfunc:gn-11l, 
in main:gn-12 
-bash-4.24 
从 上 例 中 可 以 看 到 , 全 局 变量 gn 首先 在 子 线程 中 递增 1, 子 线程 结束 后 , 再 在 主线 程 中 递增 1。 
两 个 线程 都 对 同一 个 全 局 变量 进行 了 访问 。 


8.32 ”线程 的 属性 

POSIX 标准 规定 线程 具有 多 个 属性 。 那 么 ， 具 体 有 哪些 属性 呢 ? 线程 主要 的 属性 包括 分 离 状 
Æ (detached state) 、 调 度 策略 和 参数 (scheduling policy and parameters) 、 作 用 域 (scope) 、 栈 
尺寸 (stack size) 、 栈 地 址 〈stack address) 、 优 先 级 (priority) 等 。Linux 为 线程 属性 定义 了 一 个 
联合 体 pthread_attr t， 注 意 是 联合 体 而 不 是 结构 体 ， 定 义 在 /usrinclude/bits/ pthreadtypes.h 中 ， 代 码 
如 下 : 








union pthread attr t 

{ 
char  size[ SIZEOF PTHREAD ATTR T]; 
long int align; 

N 
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从 这 个 定义 中 可 以 看 出 , 属性 值 都 是 存放 在 数组 _size 中 的 。 这 样 很 不 方便 存 取 。 别 急 ，Linux 
已 经 为 我 们 准备 了 一 组 专门 用 于 存 取 属 性 值 的 函数 , 后 面具 体 讲 属 性 的 时 候 会 看 到 。 如 果 要 获取 线 
程 的 属性 ， 首 先 要 用 函数 pthread_getattr np 来 获取 属性 结构 体 值 ， 再 用 相应 的 函数 来 具体 获得 某 
个 属性 值 。 函 数 pthread getattr np 声明 如 下 : 


int pthread getattr np(pthread t thread, pthread attr t *attr); 


其 中 ,参数 thread 是 线程 ID，attr 返回 线程 属性 结构 体 的 内 容 。 如 果 函 数 执行 成 功 就 返回 0， 否 则 
返回 错误 码 。 注 意 ， 使 用 该 函数 需要 定义 宏 _ GNU_SOURCE， 而 且 要 在 pthread.h 前 定义 ， 具 体 如 下 : 

#define GNU SOURCE /* See feature test macros(7) */ 

#include <pthread.h> 

当 函 数 pthread_getattr np 获得 的 属性 结构 体 变量 不 再 需要 的 时 候 ， 应 该 用 函数 
pthread attr destroy 进行 销毁 。 

我 们 前 面 用 pthread_create 创建 线程 的 时 候 ， 属 性 结构 体 指针 参数 用 了 NULL， 此 时 创建 的 线 
程 具有 默认 属性 ， 即 为 非 分 离 、 大 小 为 1MB 的 堆栈 ， 与 父 进程 有 同样 级 别 的 优先 级 。 如 果 要 创建 
非 默认 属性 的 线程 ， 可 以 在 创建 线程 之 前 用 函数 pthread_attr_init 来 初始 化 一 个 线程 属性 结构 体 ， 
再 调用 相应 API 函数 来 设置 相应 的 属性 ， 接 着 把 属性 结构 体 的 地 址 参 作为 数 传 入 pthread_create。 
函数 pthread_attr_init 声明 如 下 : 

int pthread attr init(pthread attr t *attr); 

其 中 ， 参 数 attr 为 指向 线程 属性 结构 体 的 指针 。 如 果 函 数 执行 成 功 就 返回 0， 否则 返回 一 个 错 
误 码 。 

需要 注意 的 一 点 是 : 使 用 pthread attr init 初始 化 线程 属性 ， 之 后 〈 传 入 pthread_create) 需要 
使 用 pthread attr destroy 销毁 ， 从 而 释放 相关 资源 。 函 数 pthread_attr_destroy 声明 如 下 : 





int pthread attr destroy (Pthread_attr t *attr); 


其 中 ， 参 数 atte 为 指向 线程 属性 结构 体 的 指针 。 如 果 函 数 执行 成 功 就 返回 0， 否则 返回 一 个 错 
误 码 。 

除了 创建 时 指定 属性 外 ， 我 们 也 可 以 通过 一 些 API 函数 来 改变 已 经 创建 了 线程 的 默认 属性 ， 
后 面 讲 具体 属性 的 时 候 再 详 述 。 线 程 属性 的 设置 方法 我 们 基本 了 解 了 , 那 获取 线程 属性 的 方法 呢 ? 
答案 是 通过 函数 pthread_getattr np， 该 函数 可 以 获取 某 个 正在 运行 的 线程 的 属性 ， 函 数 声明 如 下 : 








int pthread getattr np(pthread t thread, pthread attr t *attr); 

其 中 , 参数 thread 是 要 获取 属性 的 线程 ID，attr TER IB 381 S Js TE «Br AR RRT CUIR 
回 0， 否 则 为 错误 码 。 

下 面 我 们 通过 例子 来 演示 一 下 该 函数 的 使 用 。 

1. 分 离 状态 

分 离 状态 (detached state) 是 线程 一 个 很 重要 的 属性 。POSIX 线程 的 分 离 状态 决定 一 个 线程 以 
什么 样 的 方式 来 终止 自己 。 要 注意 和 前 面 线 程 的 状态 进行 区 别 , 前 面 所 说 的 线程 的 状态 是 不 同 操作 
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系统 上 的 线程 都 有 的 状态 (线程 当前 活动 状态 的 说 明 )， 而 这 里 所 说 的 分 离 状态 是 POSIX 标准 
下 的 属性 所 特有 的 ， 用 于 表明 该 线程 以 何 种 方式 终止 自己 。 默认 的 分 离 状态 是 可 连接 ， 即 我 们 
创建 线程 时 如 果 使 用 默认 属性 ， 则 分 离 状 态 属性 就 是 可 连接 的 ， 因 此 ， 默 认 属 性 下 创建 的 线程 
是 可 连接 线程 。 

POSIX 下 的 线程 要 么 是 分 离 的 ， 要 么 是 非 分 离 状 态 的 〈 也 称 可 连接 的 ，joinable) 。 前 者 用 宏 
PTHREAD CREATE DETACHED 表示 ， 后 者 用 宏 PTHREAD CREATE JOINABLEb 表示 。 默 认 
情况 下 创建 的 线程 是 可 连接 的 ， 一 个 可 结合 的 线程 是 可 以 被 其 他 线程 收回 资源 和 杀 死 〈 或 称 取消 ) 
的 ， 并 且 它 不 会 主动 释放 资源 〈 比 如 栈 空间 ) ， 必 须 等 待 其 他 线程 来 回收 其 资源 。 因 此 我 们 要 在 主 
线程 使 用 pthread join 函数 ， 该 函数 是 一 个 阻塞 函数 ， 当 它 返 回 时 ， 所 等 待 的 线程 的 资源 也 就 被 释 
放 了 。 再 次 强调 ， 如 果 是 可 连接 的 线程 ， 当 线程 函数 自己 返回 结束 时 或 调用 pthread_exit 结束 时 都 
不 会 释放 线程 所 占用 的 堆栈 和 线程 描述 符 (总计 八 千 多 字 节 ) ， 必 须 调 用 pthread join 且 返 回 后 ， 
这 些 资 源 才 会 被 释放 。 这 对 于 父 进程 长 时 间 运 行 的 进程 来 说 ， 其 结果 会 是 灾难 性 的 。 因 为 父 进程 不 
退出 并 且 没 有 调用 pthread join， 所 以 这 些 可 连接 的 线程 资源 就 一 直 没 有 释放 ， 相 当 于 变 成 僵尸 线 
程 了 ， 僵 尸 线程 越 来 越 多 ， 以 后 再 想 创建 新 线程 将 变 得 没有 资源 可 用 。 

如 果 不 用 pthread join, 并 且 父 进程 先 于 可 连接 的 子 线程 退出 , 那么 会 不 会 泄露 资源 呢 ? 答 
案 是 不 会 的 。 如 果 父 进程 先 于 子 线程 退出 ， 那 么 它 将 被 init 进程 所 收养 ， 这 个 时 候 init 进程 就 
是 它 的 父 进程 ， 将 调用 wait 系列 函数 为 其 回收 资源 。 再 说 一 遍 ， 一 个 可 连接 的 线程 所 占用 的 内 
存 仅 当 有 线程 对 其 执行 pthread. join 后 才 会 释放 ， 为 了 避免 内 存 泄漏 ， 可 连接 的 线程 在 终止 时 ， 
要 么 被 设 为 DETACHED (可 分 离 ) ， 要 么 使 用 pthread join 来 回收 资源 。 另 外 ， 一 个 线程 不 能 
被 多 个 线程 等 待 ， 否 则 第 一 个 接收 到 信号 的 线程 成 功 返 回 ， 其 余 调 用 pthread join 的 线程 将 得 
到 错误 代码 ESRCH。 

了 解 了 可 连接 线程 ， 我 们 再 来 看 可 分 离 的 线程 。 这 种 线程 运行 结束 时 ， 其 资源 将 立刻 被 系统 
回收 。 可 以 理解 为 这 种 线程 能 独立 〈 分 离 ) 出 去 ， 可 以 自生 自 灭 ， 父 线程 不 用 管 。 将 一 个 线程 设置 
为 可 分 离 状 态 有 两 种 方式 。 一 种 是 调用 函数 pthread_detach， 将 线程 转换 为 可 分 离线 程 。 另 一 种 是 
在 创建 线程 时 就 将 它 设置 为 可 分 离 状态 , 基本 过 程 是 首先 初始 化 一 个 线程 属性 的 结构 体 变 量 (通过 
函数 pthread_attr_init) ， 然 后 将 其 设置 为 可 分 离 状 态 〈 通 过 函数 pthread_attr_setdetachstate) ， 最 
后 将 该 结构 体 变 量 的 地 址 作为 参数 传 入 线程 创建 函数 pthread_create， 这 样 所 创建 出 来 的 线程 就 直 
接 处 于 可 分 离 状 态 。 

函数 pthread_attr_setdetachstate 用 来 设置 线程 的 分 离 状态 属性 ， 声 明 如 下 : 

















int pthread attr setdetachstate(pthread attr t * attr, int detachstate); 


其 中 ， 参 数 aur 是 要 设置 的 属性 结构 体 ; detachstate 是 要 设置 的 分 离 状态 值 ， 可 以 取 值 
PTHREAD CREATE DETACHED 或 PTHREAD_CREATE_JOINABLE。 如 果 函 数 执行 成 功 就 返回 
0， 否 则 返回 非 零 错误 码 。 

【 例 8.6】 创 建 一 个 可 分 离线 程 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 如 下 : 





#include <iostream> 
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#include «pthread.h» 
using namespace std; 


void *thfunc(void *arg) 

t 
cout<< ("sub thread is running Mn"); 
return NULL; 


int main(int argc, char *argv[]) 


pthread t thread id; 

pthread attr t thread attr; 
struct sched param thread param; 
Size t stack size; 

int res; 


res = pthread attr init(&thread attr); 
if (res) 
cout««"pthread attr init failed:"««res««endl; 


res - pthread attr setdetachstate( &thread attr,PTHREAD CREATE DETACHED); 
if (res) 
cout««"pthread attr setdetachstate failed:"««res««endl; 


res = pthread create(  &thread id, &thread attr, thfunc, 
NULL); 
if (res ) 


cout««"pthread create failed:"««res««endl; 
cout««"main thread will exitWn"««endl; 


sleep(1); 
return 0; 


) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结 果 如 下 : 
rootülocalhost test]# g++ -o test test.cpp -lpthread 


rootélocalhost test]# ./test 
main thread will exit 


sub thread is running 
rootélocalhost test]# 


在 上 面 的 代码 中 ， 我 们 首先 初始 化 了 一 个 线程 属性 结构 体 ， 然 后 设置 其 分 离 状态 为 
PTHREAD CREATE DETACHED, 并 用 这 个 属性 结构 体 作为 参数 传 入 线程 创建 函数 中 。 这 样 创建 
出 来 的 线程 就 是 可 分 离线 程 。 意 味 着 该 线程 结束 时 ， 它 所 占用 的 任何 资源 都 可 以 立刻 被 系统 回收 。 
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程序 的 最 后 ， 我 们 让 main 线程 挂 起 1 秒 ， 让 子 线程 有 机 会 执行 。 因 为 如 果 main 线程 很 早 就 退出 ， 
将 会 导致 整个 进程 很 早退 出 ， 子 线程 就 没 机 会 执行 了 。 

有 朋友 可 能 会 想 ， 如 果子 线程 执行 的 时 间 长 ， 那 么 sleep 到 底 应 该 睡眠 多 少 秒 呢 ? 有 没有 一 种 
机 制 不 用 sleep 函数 ， 而 让 子 线程 完整 执行 呢 ? 答案 是 肯定 的 ， 对 于 可 连接 线程 ， 主 线程 可 以 用 
pthread join 函数 等 待 子 线程 结束 。 而 对 于 可 分 离线 程 ， 并 没有 这 样 的 函数 ， 但 可 以 采用 这 样 的 方 
ik: 先 让 主线 程 退出 而 进程 不 退出 ， 一 直 等 到 子 线程 退出 了 ， 进 程 才 退 出 ， 即 在 主线 程 中 调用 函数 
pthread_exit， 在 main 线程 中 如 果 调 用 了 pthread_exit， 那 么 此 时 终止 的 只 是 main 线程 ， 而 进程 的 
资源 会 为 由 main 线程 创建 的 其 他 线程 保持 打开 的 状态 ， 直 到 其 他 线程 都 终止 。 值 得 注意 的 是 ， 如 
果 在 非 main 线程 (其 他 子 线 程 》 中 调用 pthread_exit 就 不 会 有 这 样 的 效果 ， 只 会 退出 当前 子 线程 。 
下 面 我 们 重新 改写 上 例 ， 不 用 sleep， 显 得 更 专业 一 些 。 


【 例 8.7】 创 建 一 个 可 分 离线 程 ， 且 main 线程 先 退 出 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 








#include <iostream> 
#include <pthread.h> 


using namespace std; 


void *thfunc(void *arg) 

{ 
cout<< ("sub thread is running\n"); 
return NULL; 


int main(int argc, char *argv[]) 


pthread t thread id; 

pthread attr t thread attr; 
struct sched param thread param; 
size_t stack size; 

int res; 


res = pthread attr init(&thread attr); // 初 始 化 线程 结构 体 

if (res) 
cout<<"pthread attr init failed:"««res««endl; 

res-pthread attr setdetachstate( &thread attr,PTHREAD CREATE DETACHED); 
// 设 置 分 离 状 态 

if (res) 


cout««"pthread attr setdetachstate failed:"««res««endl; 


res = pthread create( &thread id, &thread attr, thfunc, NULL); 
// 创 建 一 个 可 分 离线 程 


if (res ) 
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cout««"pthread create failed:"««res««endl; 
cout««"main thread will exit Wn"««endl; 


pthread exit (NULL); // 主 线程 退出 ， 但 进程 不 会 此 刻 退 出 ， 下 面 的 语句 不 会 再 执行 
cout << "main thread has exited,this line will not run\n" << endl; 
// 此 句 不 会 执行 

return 0; 


) 
(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 
[root@localhost test]# g++ -o test test.cpp -lpthread 


[rootQlocalhost test]# ./test 
main thread will exit 


sub thread is running 
[rootQlocalhost test]# 


正如 我 们 所 预料 的 那样 ，main 线程 中 调用 了 函数 pthread. exit, 将 退出 main 线程 , 但 进程 并 不 
会 此 刻 退 出 ， 而 是 要 等 到 子 线程 结束 后 才 退 出 。 因 为 是 分 离线 程 ， 它 结束 的 时 候 ， 所 占用 的 资源 会 
立刻 被 系统 回收 。 如 果 是 一 个 可 连接 (joinable) 线程 ， 则 必须 在 创建 它 的 线程 中 调用 pthread join 
来 等 待 可 连接 线程 结束 并 释放 该 线程 所 占 的 资源 。 因此 上 面 的 代码 中 , 如果 我 们 创建 的 是 可 连接 线 
程 , 则 main 函数 中 不 能 调用 pthread_exit 预先 退出 。 在 此 我 们 再 总 结 一 下 可 连接 线程 和 可 分 离线 程 
最 重要 的 区 别 : 在 任何 一 个 时 间 点 上 ， 线 程 是 可 连接 的 〈joinable) ， 或 者 是 分 离 的 〈detached) 。 
一 个 可 连接 的 线程 在 自己 退出 时 或 pthread_exit 时 都 不 会 释放 线程 所 占用 堆栈 和 线程 描述 符 〔 总 计 
八 千 多 字 节 ) ， 需 要 通过 其 他 线程 调用 pthread join 之 后 ， 这 些 资 源 才 会 被 释放 ; 相反 ， 一 个 分 离 
的 线程 是 不 能 被 其 他 线程 回收 或 杀 死 的 ， 它 所 占用 的 资源 在 终止 时 由 系统 自动 释放 。 

除了 直接 创建 可 分 离线 程 外 ， 还 能 把 一 个 可 连接 线程 转换 为 可 分 离线 程 ， 这 有 一 个 好 处 ， 就 
是 把 线程 的 分 离 状 态 转 为 可 分 离 后 ， 它 自己 退出 或 调用 pthread_exit， 就 可 以 由 系统 回收 其 资源 了 。 
转换 方法 是 调用 函数 pthread_detach， 该 函数 可 以 把 一 个 可 连接 线程 转变 为 一 个 可 分 离线 程 ， 声 明 
如 下 : 








int pthread detach(pthread t thread); 


其 中 ， 参 数 thread 是 要 设置 为 分 离 状态 的 线程 的 ID 。 如 果 函 数 执行 成 功 就 返回 0， 否 则 返回 
一 个 错误 码 ， 比 如 错误 码 EINVAL 表示 目标 线程 不 是 一 个 可 连接 的 线程 ，ESRCH 表示 该 ID 的 线 
程 没有 找到 。 要 注意 的 是 ， 如 果 一 个 线程 已 经 被 其 他 线程 连接 了 ， 则 pthread detach 不 会 产生 作用 ， 
且 该 线程 继续 处 于 可 连接 状态 。 同 时 ， 如 果 一 个 线程 成 功 地 进行 pthread_detach 后 ， 再 想 要 去 连 
接 它 ， 则 必定 失败 。 

下 面 我 们 来 看 一 个 例子 ， 首 先 创建 一 个 可 连接 线程 ， 然 后 获取 其 分 离 状态 ， 再 把 它 转换 为 可 
分 离线 程 ， 再 来 获取 其 分 离 状 态 属性 。 获 取 分 离 状 态 的 函数 是 pthread_attr_getdetachstate， 该 函数 
声明 如 下 : 
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int 


pthread attr getdetachstate(pthread attr t *attr, int *detachstate); 


其 中 ， 参 数 attr 为 属性 结构 体 指针 ，detachstate 返回 分 离 状态 。 如 果 函 数 执行 成 功 就 返回 0, 
否则 返回 错误 码 。 
【 例 8.8】 获 取 线 程 的 分 离 状 态 属性 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#ifndef GNU SOURCE 

ddefine GNU SOURCE /* To get pthread getattr np() declaration */ 
#endif 

#include <pthread.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <errno.h> 


#define handle error en(en, msg) V // 输 出 自 定义 的 错误 信息 


do ( errno = en; perror(msg); exit (EXIT FAILURE); ) while (0) 


static void * thread start(void *arg) 


( 


int 


dnt i,sr 


pthread attr t gattr; // 定 义 线程 属性 结构 体 


S = pthread getattr np(pthread self(), &gattr); 


// 获 取 当 前 线程 属性 结构 值 ， 该 函数 前 面 讲 过 了 
if (s != 0) 
handle error en(s, "pthread getattr np"); // 打 印 错误 信息 


printf("Thread's detachstate attributes: Wn"); 
s = pthread_attr_getdetachstate(&gattr,&i);// 从 属性 结构 值 中 获取 分 离 状 态 属性 


if (s) 
handle error en(s, "pthread attr getdetachstate"); 





printf("Detach state = $sWn", // 打 印 当前 分 离 状态 属性 
(i == PTHREAD CREATE DETACHED) ? "PTHREAD CREATE DETACHED" : 
(i == PTHREAD CREATE JOINABLE) ? "PTHREAD CREATE JOINABLE" : 
ipie e en 


pthread attr destroy(&gattr); 


main(int argc, char *argv[]) 


pthread t thr; 
int s; 


s = pthread create(&thr, NULL, &thread start, NULL); // 创 建 线程 
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if (s != 0) 

t 
handle error en(s, "pthread create"); 
return 0; 


) 


pthread join(thr, NULL); // 等 待 子 线程 结束 
return 0; 


} 
(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost Debug]# ./test 
Thread's detachstate attributes: 
Detach state = PTHREAD CREATE JOINABLE 


从 运行 结果 可 见 , 默认 创建 的 线程 就 是 一 个 可 连接 线程 ， 即 其 分 离 状态 属性 是 可 连接 的 。 下面 
我 们 再 看 一 个 例子 ， 把 一 个 可 连接 线程 转换 成 可 分 离线 程 ， 并 查看 其 前 后 的 分 离 状 态 属性 。 
【 例 8.9】 把 可 连接 线程 转换 为 可 分 离线 程 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 





#ifndef GNU SOURCE 

#define GNU SOURCE /* To get pthread getattr np() declaration */ 
#endif 

#include <pthread.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <unistd.h> 

#include <errno.h> 


static void * thread start (void *arg) 
t 
Lnt ps 
pthread attr t gattr; 
S = pthread getattr np(pthread self(), &gattr); 
if (s != 0) 
printf("pthread getattr np failedWin"); 


S = pthread attr getdetachstate(&gattr, &i); 





if (s) 

printf( "pthread attr getdetachstate failed"); 
printf("Detach state = $sWMn", 

(i == PTHREAD CREATE DETACHED) ? "PTHREAD CREATE DETACHED" : 





(et PTHREAD CREATE JOINABLE) ? "PTHREAD CREATE JOINABLE" : 
Nom 
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pthread detach(pthread self()); // 转 换 线程 为 可 分 离线 程 


S = pthread getattr np (pthread self(), &gattr); 
if (s !- 0) 

printf("pthread getattr np failedWn"); 
S = pthread attr getdetachstate(&gattr, &i); 


if (s) 
printf(" pthread attr getdetachstate failed"); 
printf("after pthread detach, nDetach state = $sWMn", 


(i == PTHREAD CREATE DETACHED) ? "PTHREAD CREATE DETACHED" : 
PTHREAD CREATE JOINABLE) ? "PTHREAD CREATE JOINABLE" : 





(i 
elg. 





pthread attr destroy(&gattr); // 销 毁 属性 
} 


int main(int argc, char *argv[]) 
{ 

pthread t thread id; 

int s; 


s = pthread create(&thread id, NULL, &thread start, NULL); 
if (s !- 0) 
t 
printf("pthread create failedWin"); 
return 0; 
) 
pthread exit (NULL); // 主 线程 退出 ， 但 进程 并 不 马上 结束 
) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 


是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结 果 如 下 : 


[root@localhost Debug]# ./test 

Detach state = PTHREAD CREATE JOINABLE 
after pthread detach, 

Detach state = PTHREAD CREATE DETACHED 


2. 栈 尺寸 
除了 分 离 状 态 属 性 外 ， 线 程 的 另 一 个 重要 属性 是 栈 尺 寸 。 这 对 于 我 们 在 线程 函数 中 开设 栈 上 


的 内 存 空 间 非 常 重要 。 局 部 变量 、 函数 参数 、 返回 地 址 等 都 存放 在 栈 空间 里 , 而 动态 分 配 的 内 存 ( 比 
如 用 malloc) 或 全 局 变量 等 都 属于 堆 空间 。 我 们 学 了 栈 尺寸 属性 后 , 注意 在 线程 函数 中 开设 局 部 变 
量 (尤其 是 数组 ) 不 要 超过 默认 栈 尺寸 大 小 。 获 取 线程 栈 尺寸 属性 的 函数 是 pthread_attr_getstacksize， 
声明 如 下 : 


int pthread attr getstacksize (pthread attr t *attr, size t *stacksize); 


其 中 ， 参 数 attr 指向 属性 结构 体 ，stacksize 用 于 获得 栈 尺寸 (单位 是 字 节 ) ， 指 向 size t 类 型 
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的 变量 。 如 果 函 数 执行 成 功 就 返回 0， 和 否则 返回 错误 码 。 
【 例 8.10】 获 得 线程 默认 栈 尺寸 大 小 和 最 小 尺寸 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 





#ifndef GNU SOURCE 
#define GNU SOURCE /* To get pthread getattr np() declaration */ 
#endif 
#include <pthread.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 
#include <errno.h> 
#include <limits.h> 
static void * thread _ start (void *arg) 
{ 
int i,res; 
size t stack size; 
pthread attr t gattr; 


res = pthread getattr np(pthread self(), &gattr); 
if (res) 
printf ("pthread getattr np failedWin"); 


res = pthread attr getstacksize(&gattr, &stack size); 
if (res) 
printf("pthread getattr np failedWn"); 


printf("Default stack size is $u byte; minimum is $u byte Wn", stack size, 
PTHREAD STACK MIN); 


pthread attr destroy(&gattr); 


int main(int argc, char *argv[]) 
t 

pthread t thread id; 

int s; 


S = pthread create(&thread id, NULL, &thread start, NULL); 
if (s !- 0) 
t 
printf("pthread create failedWn"); 
return 0; 
b 
pthread join(thread id, NULL); // 等 待 子 线程 结束 
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(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost Debug]# ./test 
Default stack size is 8392704 byte; minimum is 16384 byte 


3. 调度 策略 

线程 的 调度 策略 也 是 线程 的 一 个 重要 属性 。 一 个 线程 肯定 有 一 种 策略 来 调度 它 。 进 程 中 有 了 
多 个 线程 后 ， 就 要 管理 这 些 线程 如 何 去 占 用 CPU， 这 就 是 线程 调度 。 线 程 调度 通常 由 操作 系统 来 
安排 ,不 同 操作 系统 的 调度 方法 (或 称 调度 策略 ) 不 同 ， 比 如 有 的 操作 系统 采用 轮 询 法 来 调度 。 在 
理解 线程 调度 之 前 , 先 要 了 解 一 下 实时 与 非 实 时 。 实时 就 是 指 操作 系统 对 一 些 中 断 等 的 响应 时 效 性 
非常 高 ， 非 实时 正好 相反 。 目 前 ， VxWorks 属于 实时 操作 系统 ，Windows 和 Linux 则 属于 非 实 时 
操作 系统 ， 也 叫 分 时 操作 系统 。 响 应 实时 的 表现 主要 是 抢占 ,抢占 通过 优先 级 来 控制 ,优先 级 高 的 
任务 最 先 占用 CPU。 

Linux 虽然 是 一 个 非 实 时 操作 系统 ,但 其 线程 也 有 实时 和 分 时 之 分 ， 具体 的 调度 策略 可 以 分 为 
3 种 : SCHED_OTHER (分 时 调度 策略 ) 、SCHED_FIFO〈 先 来 先 服务 调度 策略 ) ~ SCHED. RR 
(实时 调度 策略 ， 时 间 片 轮转 ) 。 我 们 创建 线程 的 时 候 可 以 指定 其 调度 策略 ， 默 认 的 调度 策略 是 
SCHED OTHER, SCHED FIFO 和 SCHED RR 只 用 于 实时 线程 。 


(1) SCHED OTHER 

SCHED OTHER 表示 分 时 调度 策略 (也 可 称 轮转 策略 ) ， 是 一 种 非 实时 调度 策略 ， 系 统 会 为 
每 个 线程 分 配 一 段 运行 时 间 ， 称 为 时 间 片 。 该 调度 策略 是 不 支持 优先 级 的 ,如果 我 们 去 获取 该 调度 
策略 下 的 最 高 和 最 低 优先 级 ， 可 以 发 现 都 是 0。 该 调度 策略 有 点 像 排 队 上 公共 厕所 ， 前 面 的 人 占用 
了 位 置 ， 不 出 来 的 话 ， 后 面 的 人 是 轮 不 上 的 ， 而 且 不 能 强行 赶 出 来 〈 不 支持 优先 级 ， 没 有 VIP 特 
权 之 说 ) 。 


(2) SCHED FIFO 

SCHED FIFO 表示 先 来 先 服务 调度 策略 ， 支 持 优 先 级 抢占 。SCHED_FIFO 策略 下 ，CPU 让 一 
个 先 来 的 线程 执行 完 再 调度 下 一 个 线程 ， 顺 序 就 是 按照 创建 线程 的 先后 。 线 程 一 旦 占用 CPU 就 会 
一 直 运行 ， 直 到 有 更 高 优先 级 的 任务 到 达 或 自己 放弃 CPU。 如 果 有 和 正在 运行 的 线程 具有 同样 优 
先 级 的 线程 已 经 就 绪 ， 就 必须 等 待 正在 运行 的 线程 主动 放弃 后 才 可 以 运行 这 个 就 绪 的 线程 。 
SCHED FIFO 策略 下 ， 可 设置 的 优先 级 范围 是 1-99. 


(3) SHCED RR 

SHCED RR 表示 时 间 片 轮转 〈 轮 循 ) 调度 策略 ， 但 支持 优先 级 抢占 ， 因 此 也 是 一 种 实时 调度 
策略 。SHCED_RR 策略 下 ，CPU 会 分 配给 每 个 线程 一 个 特定 的 时 间 片 ， 当 线程 的 时 间 片 用 完 时 ， 
系统 将 重新 分 配 时 间 片 , 并 将 线程 置 于 实时 线程 就 绪 队 列 的 尾部 , 这 样 就 保证 了 所 有 具有 相同 优先 
级 的 线程 能 够 被 公平 地 调度 。 

下 面 我 们 来 看 一 个 例子 ， 获 取 这 3 种 调度 策略 下 可 设置 的 最 小 和 最 大 优先 级 ， 主 要 使 用 的 函 
数 是 sched get priority min 和 sched_get_priority_max。 这 两 个 函数 都 在 sched.h 中 声明 , 具体 如 下 : 
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int sched get priority min(int policy); 

int sched get priority max(int policy); 

该 函数 获取 实时 线程 可 设置 的 最 低 和 最 高 优先 级 值 。 其 中 , 参数 policy 为 调度 策略 ， 可 以 取 值 
为 SCHED FIFO、SCHED RR 或 SCHED_OTHER。 函 数 返 回 可 设置 的 最 低 优先 级 。 对 于 
SCHED_OTHER， 由 于 是 分 时 策略 ， 因 此 返回 0; 另外 两 个 策略 返回 的 最 低 优先 级 是 1， 最 高 优先 
级 是 99。 


【 例 8.11】 获 取 线 程 3 种 调度 策略 下 可 设置 的 最 小 和 最 大 优先 级 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <stdio.h> 
#include <unistd.h> 
#include <sched.h> 
main () 
{ 
printf ("Valid priority range for SCHED OTHER: $d - d\n", 
sched get priority min (SCHED OTHER)，// 获 取 SCHED OTHER 的 可 设置 的 最 低 优先 级 
sched get priority max(SCHED OTHER) ) ;// 获 取 SCHED OTHER 的 可 设置 的 最 高 优先 级 
printf("Valid priority range for SCHED FIFO: $d - $dWn", 
sched get priority min(SCHED FIFO), // 获 取 SCHED FIFO 的 可 设置 的 最 低 优先 级 
sched get priority max (SCHED FIFO)); // 获 取 SCHED_FIFo 的 可 设置 的 最 高 优先 级 
printf("Valid priority range for SCHED RR: $d - $dWn", 
sched get priority min(SCHED RR)，// 获 取 SCHED RR 的 可 设置 的 最 低 优先 级 
sched get priority max (SCHED RR)); // 获 取 SCHED RR 的 可 设置 的 最 高 优先 级 
| 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost Debug]# ./test 

Valid priority range for SCHED OTHER: 0 - 0 

Valid priority range for SCHED FIFO: 1 - 99 

Valid priority range for SCHED RR: 1 - 99 

对 于 SCHED FIFO 和 SHCED RR 调度 策略 ， 由 于 支持 优先 级 抢占 ， 因 此 具有 高 优先 级 的 可 
运行 的 (就绪 状态 下 的 ) 线程 总 是 先 运行 。 如果 一 个 正在 运行 的 线程 在 未 完成 其 时 间 片 时 ， 出 现 一 
个 更 高 优先 级 的 线程 就 绪 , 那么 正在 运行 的 这 个 线程 就 可 能 在 未 完成 其 时 间 片 前 被 抢占 。 甚 至 一 个 
线程 会 在 未 开始 其 时 间 片 前 就 被 抢占 了 , 而 要 等 待 下 一 次 被 选择 运行 。 当 Linux 系统 切换 线程 的 时 
候 ， 将 执行 一 个 上 下 文 转换 的 操作 ， 即 保存 正在 运行 的 线程 的 相关 状态 ， 装 载 另 一 个 线程 的 状态 ， 
开始 新 线程 的 执行 。 

需要 说 明 的 是 ， 虽 然 Linux 支持 实时 调度 策略 〈 比 如 SCHED_FIFO 和 SCHED_RR) ， 但 它 依 
旧 属 于 非 实时 操作 系统 , 这 是 因为 实时 操作 系统 对 响应 时 间 有 着 非常 严格 的 要 求 , 而 Linux 作为 一 
个 通用 操作 系统 达 不 到 这 一 要 求 (通用 操作 系统 要 求 能 支持 一 些 较 差 的 硬件 ,从 硬件 角度 就 达 不 到 
实时 要 求 ) 。 此 外 ，Linux 的 线程 优先 级 是 动态 的 ， 也 就 是 说 即使 高 优先 级 线程 还 没有 完成 ， 低 优 
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先 级 线程 还 是 会 得 到 一 定 的 时 间 片 。 美 国 的 宇宙 飞船 常用 的 操作 系统 VxWorks 就 是 一 个 RTOS 
(Real-Time Operating System， 实 时 操作 系统 ) 。 


8.3.3 ”线程 的 结束 


线程 安全 退出 是 编写 多 线程 程序 时 一 个 重要 的 事项 。 在 Linux F, 线程 的 结束 通常 由 以 下 原因 
所 致 : 


(1) 在 线程 函数 中 调用 pthread_exit 函数 。 

(2) 线程 所 属 的 进程 结束 了 ， 比 如 进程 调用 了 exit。 
(3) 线程 函数 执行 结束 后 返回 (return) 了 。 

(4) 线程 被 同一 进程 中 的 其 他 线程 通知 结束 或 取消 。 


第 一 种 方式 ， 与 Windows 下 的 线程 退出 函数 ExitThread 不 同 ，pthread_exit 不 会 导致 C++ 对 象 
被 析 构 ， 所 以 可 以 放心 使 用 。 第 二 种 方式 最 好 不 用 ， 因 为 线程 函数 如 果 有 C++ 对 象 ， 则 C++ 对 象 
不 会 被 销毁 。 第 三 种 方式 推荐 使 用 ， 线 程 函数 执行 到 return 后 结束 是 最 安全 的 方式 ， 尽 量 将 线程 设 
计 成 这 样 的 形式 ， 即 想 让 线程 终止 运行 时 ， 它 们 就 能 够 return〈 返 回 ) 。 最 后 一 种 方式 通常 用 于 其 
他 线程 要 求 目标 线程 结束 运行 的 情况 , 比如 目标 线程 中 执行 一 个 耗 时 的 复杂 科学 计算 , 但 用 户 等 不 
及 想 中 途 停止 它 ， 此 时 就 可 以 向 目标 线程 发 送 取消 信号 。 其 实 ，(1) 和 (3) 属于 线程 自己 主动 终 
iE, (20 和 (4) 属于 被 动 结束 ， 就 是 自己 并 不 想 结束 ， 但 外 部 线程 希望 自己 终止 。 

一 般 情 况 下 ， 进 程 中 各 个 线程 的 运行 是 相互 独立 的 ， 线 程 的 终止 并 不 会 相互 通知 ， 也 不 会 影 
响 其 他 的 线程 。 对 于 可 连接 线程 ， 它 终止 后 ， 所 占用 的 资源 并 不 会 随 着 线程 的 终止 而 归还 系统 ， 而 
是 仍 为 线程 所 在 的 进程 持 有 ， 可 以 调用 pthread join 函数 来 同步 并 释放 资源 (这 一 点 前 面 已 经 讲 过 
了 ， 这 里 又 喝 唆 了 一 遍 ， 希 望 记 住 》。 

1 线程 主动 结束 

线程 主动 结束 一 般 是 线程 函数 中 使 用 return 语句 或 调用 pthread_exit 函数 。 函 数 pthread_exit 
声明 如 下 : 


void pthread exit (void *retval); 


其 中 , 参数 retval 就 是 线程 退出 的 时 候 返 回 给 主线 程 的 值 .注意 , 线程 函数 的 返回 类 型 是 void*。 
另外 ， 在 main 线程 中 调用 “pthread_exit(NULL);” 的 时 候 ， 将 结束 main 线程 ， 但 进程 并 不 立即 退 
出 。 

下 面 来 看 一 个 线程 主动 结束 的 例子 。 

【 例 8.12】 线 程 终止 并 得 到 线程 的 退出 码 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 








#include <pthread.h> 
#include <stdio.h> 

#include <string.h> 
#include <unistd.h> 
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#include «errno.h» 
#define PTHREAD NUM 2 


void *thrfuncl(void *arg) // 第 一 个 线程 函数 
{ 
static int count = 1; // 这 里 需要 的 是 静态 变量 
pthread exit ((void*) (&count)); // 通 过 pthread exit 结 束 线程 
void *thrfunc2 (void *arg) 
{ 
static int count = 2; 
return (void *)(&count); // 线 程 函数 返回 


int main(int argc, char *argv[]) 


pthread t pid[PTHREAD NUM]; // 定 义 两 个 线程 ia 
int retPid; 

int *pRetl; // 注 意 这 里 是 指针 

int * pRet2; 


if ((retPid = pthread create(&pid[0], NULL, thrfuncl, NULL)) !- 0) 
// 创 建 第 1 个 线程 
t 
perror("create pid first failed"); 
return -1; 
) 
if ((retPid = pthread create(&pid[1], NULL, thrfunc2, NULL)) !- 0) 
// 创 建 第 2 个 线程 
t 
perror("create pid second failed"); 
return -1; 


) 


if (pid[0] !- 0) 
t 
pthread join(pid[0], (void**)& pRetl); // 注 意 pthread join 的 第 二 个 参数 的 用 法 
printf("get thread 0 exitcode: sd\n"，* pRet1); // 打 印 线程 返回 值 
} 
if (pid[1] != 0) 
t 
pthread join(pid[1], (void**)& pRet2); 
printf("get thread 1 exitcode: $dWn", * pRet2); // 打 印 线程 返回 值 
} 
return 0; 


) 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
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是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost Debug]# ./test 

get thread 0 exitcode: 1 

get thread 1 exitcode: 2 

从 这 个 例子 可 以 看 到 ， 线 程 返回 值 有 两 种 方式 ， 一 种 是 调用 函数 pthread_exit， 另 一 种 是 直接 
return。 此 外 ， 这 个 例子 中 用 了 不 少 强 制 转换 ， 这 里 要 稍微 哩 唆 一 下 ， 首 先 看 函数 thrfuncl 中 的 最 
后 一 句 pthread_exit((void*)(&count));， 我 们 知道 pthread exit 函数 的 参数 类 型 为 void *， 因 此 只 能 
通过 指针 的 形式 出 去 , 故 先 把 整 型 变量 count 转换 为 整 型 指针 , 即 &count, 那么 &count 为 int* 类 型 ， 
这 个 时 候 再 与 void* 匹 配 ， 需 要 进行 强制 转换 ， 也 就 是 代码 中 的 (void*)(&count);。 函 数 thrfunc2 中 
的 retum 关键 字 返 回 值 的 时 候 ， 同 样 也 需要 进行 强制 类 型 的 转换 ， 线 程 函数 的 返回 类 型 是 void*， 
那么 对 于 count 整 型 变量 来 说 ， 必 须 转换 为 void 型 的 指针 类 型 (void* ) ， 因 此 有 
(void*)((int*)&count); 。 

介绍 完了 返回 的 情况 ， 我 们 再 来 介绍 一 下 接收 。 对 于 接收 返回 值 的 函数 pthread join 来 说 ， 有 
两 个 作用 ， 其 一 是 等 待 线程 结束 ， 其 二 是 获取 线程 结束 时 的 返回 值 。pthread join 的 第 二 个 参数 类 
型 是 void** 二 级 指针 ， 那 么 我 们 就 把 整 型 指针 pRetl 的 地 址 〈int** 类 型 ) 赋 给 它 ， 再 显 式 地 转 为 
void** 即 可 。 

要 注意 一 点 ， 返 回 整 数 数值 的 时 候 使 用 了 static 关键 字 ， 这 是 因为 必须 确定 返回 值 的 地 址 是 不 
变 的 。 如 果 不 用 static， 则 对 于 count 变量 而 言 ， 以 内 存 上 来 讲 ， 属 于 在 栈 区 开辟 的 变量 ， 那 么 在 
调用 结束 的 时 候 ， 必 然 是 释放 内 存 空 间 的 ， 相 对 而 言 ， 这 时 候 就 没 办 法 找到 count 所 代表 内 容 的 地 
址 空间 。 这 就 是 为 什么 很 多 人 在 看 到 swap 交换 函数 的 时 候 ， 写 成 swap(int,int) 是 没有 办 法 进行 交换 
的 。 因此 ， 如 果 我 们 需要 修改 传 过 来 的 参数 ， 就 必须 使 用 这 个 参数 的 地 址 , 或 者 一 个 变量 本 身 是 不 
变 的 内 存 地 址 空间 ,这样 才 可 以 进行 修改 , 否则 修改 失败 或 者 返回 值 是 随机 值 。 而 把 返回 值 定义 成 
静态 变量 ， 这 样 线程 结束 时 ， 其 存储 单元 依然 存在 ， 这 样 做 main 线程 中 可 以 通过 指针 引用 到 它 的 
值 ， 并 打印 出 来 。 大 家 可 以 试 试 不 用 静态 变量 ， 结 果 必 将 不 同 。 还 可 以 试 着 返回 一 个 字符 串 ， 这 样 
比 返 回 一 个 整数 更 加 简单 明了 。 

2. 线程 被 动 结束 

一 个 线程 可 能 在 执行 一 项 耗 时 的 计算 任务 ， 用 户 可 能 没 耐心 ， 希 望 结束 该 线程 。 此 时 线程 就 
要 被 动 地 结束 了 。 如 何 被 动 结束 呢 ? 一 种 方法 是 在 同 进程 的 另 一 个 线程 中 通过 函数 pthread kill 发 
送信 号 给 要 结束 的 线程 ,目标 线程 收 到 信号 后 再 退出 ; 另 一 种 方法 是 在 同 进程 的 其 他 线程 中 通过 函 
数 pthread_cancel 来 取消 目标 线程 的 执行 。 我 们 先 来 看 看 pthread_kill。 向 线程 发 送信 号 的 函数 是 
pthread_kill， 注 意 它 不 是 杀 死 (kill) 线程 ， 而 是 向 线程 发 信号 ， 因 此 线程 之 间 交 流 信 息 可 以 用 这 
个 函数 。 需 要 注意 的 是 ， 接 收 信号 的 线程 必须 先 用 sigaction 函数 注册 该 信号 的 处 理 函数 。 函 数 
pthread_kill 声明 如 下 : 











int pthread kill(pthread t threadId, int signal); 


其 中 ， 参 数 threadld 是 接收 信号 的 线程 的 线程 ID; signal 是 信号 ， 通 常 是 一 个 大 于 0 的 值 ， 如 
果 等 于 0， 就 用 来 探测 线程 是 否 存在 。 如 果 函 数 执行 成 功 就 返回 0， 否 则 返回 错误 码 ， 如 ESRCH 








Linux C 与 C++ 一 线 开 发 实践 





表示 线程 不 存在 ，EINVAL 表示 信号 不 合法 。 

向 指定 ID 的 线程 发 送 signal( 信 号) ， 如 果 线 程 代码 内 不 做 处 理 ， 则 按照 信号 默认 的 行为 影 
响 整 个 进程 ， 也 就 是 说 ， 如 果 你 给 一 个 线程 发 送 了 SIGQUIT， 但 线程 却 没有 实现 signal 处 理 函 数 ， 
则 整个 进程 退出 。 所以， 如果 int signal 的 参数 不 是 0， 那 么 一 定 要 清楚 到 底 要 干什么 ， 而 且 一 定 要 
实现 线程 的 信号 处 理 函 数 ， 否 则 就 会 影响 整个 进程 。 


【 例 8.13】 向 线程 发 送 请 求 结束 信号 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 





#include <iostream> 
#include <pthread.h> 
#include <signal.h> 
#include <unistd.h> //sleep 
using namespace std; 


static void on signal term(int sig) // 信 号 处 理 函 数 
i cout << "sub thread will exit" << endl; 
pthread exit (NULL); 
uM *thfunc(void *arg) 
Signal(SIGQUIT, on signal term); // 注 册 信 号 处 理 函 数 


int tm = 507 

while (true)  // 死 循环 ， 模 拟 一 个 长 时 间 计 算 任务 

{ 
cout «« "thrfunc--left:"««tm««" s--" ««endl; 
sleep(1); 
tm--; // 每 过 一 秒 ，tm 就 减 一 

) 


return (void *)0; 


int main(int argc, char *argv[]) 


pthread t pid; 
int res; 


res = pthread create(&pid, NULL, thfunc, NULL); // 创 建 子 线程 

sleep(5); // 让 出 cPU 5 秒 ， 让 子 线程 执行 

pthread kill (pid, STGQUIT) ;//5 秒 结束 后 ， 开 始 向 子 线程 发 送 STGQUIT 信 号 ， 通 知 其 结束 
pthread join(pid, NULL); // 等 待 子 线程 结束 

cout << "sub thread has completed,main thread will exit\n"; 

return 0; 
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(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost cpp98]# ./test 
thrfunc==left:50 s=- 

thrfunc--left:49 s-- 

thrfunc--left:48 s-- 

thrfunc--left:47 s-- 

thrfunc--left:46 s-- 

sub thread will exit 

sub thread has completed,main thread will exit 


我 们 可 以 看 到 ， 子 线程 在 执行 的 时 候 ， 主 线程 等 了 5 秒 后 就 开始 向 其 发 送信 号 SIGQUIT. TE 
子 线程 中 已 经 注册 了 SIGQUIT 的 处 理 函 数 on_signal_term。 如 果 不 注册 信号 SIGQUIT 的 处 理 函 数 ， 
就 将 调用 默认 处 理 ， 即 结束 线程 所 属 的 进程 。 大 家 可 以 试 着 把 signal(SIGQUIT, on_signal_term); 注 
释 掉 ， 再 运行 一 下 ， 就 会 发 现在 子 线程 运行 5 秒 之 后 整个 进程 结束 了 ，pthread_kill(pid, SIGQUIT); 
后 面 的 语句 不 会 再 执行 。 

既然 说 到 了 pthread_kill， 就 顺便 讲 一 种 常见 应 用 。 即 判断 线程 是 否 还 存活 。 方 法 是 先 发 送 信 
号 0〈 一 个 保留 信号 ) ， 然 后 判断 其 返回 值 ， 根 据 返回 值 就 可 以 知道 目标 线程 是 否 还 存活 着 。 请 看 
下 例 。 

【 例 8.14】 判 断 线程 是 否 已 经 结束 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> 

#include <pthread.h> 

#include <signal.h> 

#include <unistd.h> //sleep 
#include "errno.h" //for ESRCH 
using namespace std; 


void *thfunc (void *arg) // 线 程 函数 
t 
int tm = 50; 
while (1) // 如 果 要 线程 停止 ， 可 以 在 这 里 改 为 tm>48 或 其 他 
{ 
cout << "thrfunc--left:"««tm««" s--" ««endl; 
sleep(1); 
tm--; 
) 
return (void *)0; 


} 


int main(int argc, char *argv[]) 
t 

pthread t pid; 

int res; 
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res = pthread create(&pid, NULL, thfunc, NULL); // 创 建 线程 
sleep(5); 
int kill rc = pthread kill(pid, 0); // 发 送信 号 0， 探 测 线程 是 否 存活 
// 打 印 探测 结果 
if (kill rc == ESRCH) 
cout««"the specified thread did not exists or already quit\n"; 
else if (kill rc == EINVAL) 
cout««"signal is invalidWMn"; 
else 
cout««"the specified thread is aliveWMn"; 


return 0; 

) 

(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost cpp98]# g++ -o test test.cpp -lpthread 

[rootelocalhost cpp98]# ./test 

thrfunc--left:50 s-- 

thrfunc--left:49 s-- 

thrfunc--left:48 s-- 

thrfunc--left:47 s-- 

thrfunc--left:46 s-- 

the specified thread is alive 

上 面 例子 中 的 主线 程 休眠 5 秒 后 , 探测 了 子 线程 是 否 存 活 , 结果 是 活着 。 因 为 子 线程 一 直 在 死 
循环 。 如 果 要 让 探测 结果 为 子 线程 不 存在 ， 可 以 把 死 循 环 改 为 一 个 可 以 跳出 循环 的 条 件 ， 比 如 
while(tm>48)。 

除了 通过 函数 pthread_kill 发 送信 号 来 通知 线程 结束 外 , 还 可 以 通过 函数 pthread_cancel 来 取消 
某 个 线程 的 执行 。 所 谓 取 消 某 个 线程 的 执行 ， 也 就 是 发 送 取消 请 求 ， 请 求 其 终止 运行 。 注 意 ， 就 算 
发 送 成 功 ， 也 不 一 定 意味 着 线程 停止 运行 了 。 函 数 pthread_cancel 声明 如 下 : 


int pthread cancel (pthread t thread); 


其 中 ， 参 数 thread 表示 要 被 取消 线程 (目标 线程 ) 的 线程 DD。 如 果 发 送 取消 请 求 成 功 ， 则 函 
数 返 回 0， 否 则 返回 错误 码 。 发 送 取消 请 求 成 功 并 不 意味 着 目标 线程 立即 停止 运行 ， 即 系统 并 不 会 
马上 关闭 被 取消 线程 ， 只 有 在 被 取消 线程 下 次 调用 一 些 系统 函数 或 C 库 函 数 〈 比 如 print) ， 或 者 
调用 函数 pthread_testcancel〈 让 内 核 去 检测 是 否 需要 取消 当前 线程 ) 时 ， 才 会 真正 结束 线程 。 这 种 
在 线程 执行 过 程 中 检测 是 否 有 未 响应 取消 信号 的 地 方 叫 作 取消 点 。 常 见 的 取消 点 有 printf、 
pthread testcancel、read/write、sleep 等 函数 调用 的 地 方 。 如 果 被 取消 线程 停止 成 功 ， 就 将 自动 返回 
常数 PTHREAD_CANCELED (这 个 值 是 -1) ， 可 以 通过 pthread join 获得 这 个 退出 值 。 

函数 pthread_testcancel 让 内 核 去 检测 是 否 需要 取消 当前 线程 ， 声 明 如 下 : 


void pthread testcancel (void); 
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可 别 小 看 了 pthread testcancel 函数 ， 它 可 以 在 线程 的 死 循 环 中 让 系统 (内核) 有 机 会 去 检查 是 
否 有 取消 请 求 过 来 ， 如 果 不 调用 pthread_testcancel， 则 函数 pthread cancel 取消 不 了 目标 线程 。 下 
面 看 两 个 例子 ， 第 一 个 例子 不 调用 函数 pthread_testcancel， 无 法 取消 目标 线程 ;第 二 个 例子 调用 函 
数 pthread _testcancel, WRH. 取消 成 功 的 意思 是 取消 请 求 不 但 发 送 成 功 ， 而 且 目 标 线程 停止 运 
fl. 
【 例 8.15】 取 消 线程 失败 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 





#include<stdio.h> 

#include<stdlib.h> 

#include <pthread.h> 

#include <unistd.h> //sleep 

void *thfunc (void *arg) 

{ 
int i = 1; 
printf("thread start-------- Anm) 
while (1) // 死 循环 


itt; 
return (void *)0; 
int main() 


void *ret - NULL; 

int iret = 0; 

pthread t tid; 

pthread create(&tid, NULL, thfunc, NULL); // 创 建 线程 
sleep(1); 


pthread cancel(tid); // 发 送 取消 线程 的 请 求 

pthread join(tid, &ret); // 等 待 线程 结束 

if (ret == PTHREAD CANCELED) // 判 断 是 否 成 功 取消 线程 
printf("thread has stopped,and exit code: $dWMn", ret); 
// 打 印 返回 值 ， 应 该 是 -1 

else 
printf("some error occured"); 


return 0; 


) 

(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结 果 如 下 : 

[root@localhost cpp98]# ./test 

人 

^c 

[rootQlocalhost cpp98]4 
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从 运行 结果 可 以 看 到 ， 程 序 打印 thread start-------- 后 就 没 反 应 了 ， 我 们 只 能 按 Ctrl+C 键 来 停止 
进程 。 这 说 明 主 线程 中 虽然 发 送 取消 请 求 了 ， 但 并 没有 让 子 线程 停止 运行 。 因 为 如 果 停 止 运行 ， 
pthread join 是 会 返回 的 ， 然 后 会 打印 其 后 面 的 语句 。 下 面 我 们 来 改进 一 下 这 个 程序 ， 在 while 循 
环 中 加 一 个 函数 pthread_testcancel。 


【 例 8.16】 取 消 线程 成 功 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include<stdio.h> 
#include<stdlib.h> 
#include <pthread.h> 
#include <unistd.h> //sleep 
void *thfunc (void *arg) 


t 
int i = 1; 
printf ("thread start-------- Mn"); 
while (1) 
t 
i++; 
pthread testcancel(); // 让 系统 测试 取消 请 求 
) 
return (void *)0; 
) 


int main() 


void *ret = NULL; 

int iret - 0; 

pthread t tid; 

pthread create(&tid, NULL, thfunc, NULL); // 创 建 线程 
sleep(1); 


pthread cancel(tid); // 发 送 取消 线程 的 请 求 

pthread join(tid, &ret); // 等 待 线程 结束 

if (ret == PTHREAD CANCELED) // 判 断 是 否 成 功 取消 线程 
printf("thread has stopped,and exit code: %d\n", ret); 
// 打 印 返回 值 ， 应 该 是 -1 

else 
printf("some error occured"); 


return 0; 


) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread” 其 中 pthread 是 
线程 库 的 名 字 ， 然 后 运行 test， 运 行 结 果 如 下 : 
[root@localhost cpp98]# g++ -o test test.cpp -lpthread 


[rootélocalhost cpp98]# ./test 
throad otoart=====>>3 
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thread has stopped,and exit code: -1 


我 们 可 以 看 到 ， 这 个 例子 取消 线程 成 功 了 ， 目 标 线程 停止 运行 ， 返 回 pthread_join， 并 且 得 到 
的 线程 返回 值 正 是 PTHREAD_CANCELED。 原 因 就 在 于 我 们 在 while 死 循 环 中 添加 了 函数 
pthread_testcancel, 让 系统 每 次 循环 都 去 检查 一 下 有 没有 取消 请 求 。 不 用 pthread testcancel 也 可 以 ， 
可 以 在 while 循环 中 用 sleep 函数 来 代替 , 但 这 样 会 影响 while 的 速度 。 大 家 在 实际 开发 中 可 以 根据 
具体 项 目 具 体 分 析 。 


8.34 ”线程 退出 时 的 清理 机 会 

前 面 讲 了 线程 的 结束 ， 主 动 结束 可 以 认为 是 线程 正常 终止 ， 这 种 方式 是 可 预见 的 。 被 动 结束 
是 其 他 线程 要 求 其 结束 , 这 种 退出 方式 是 不 可 预见 的 ， 是 一 种 异常 终止 。 不论 是 可 预见 的 线程 终止 
还 是 异常 终止 ,都 会 存在 资源 释放 的 问题 , 在 不 考虑 因 运 行 出 错 而 退出 的 前 提 下 ,如 何 保证 线程 终 
止 时 能 顺利 地 释放 掉 自己 所 占用 的 资源 , 特别 是 锁 资 源 , 就 是 一 个 必须 解决 的 问题 。 经常 出 现 的 情 
形 是 资源 独占 锁 的 使 用 : 线程 为 了 访问 临界 资源 而 为 其 加 上 锁 , 但 在 访问 过 程 中 被 外 界 取 消 ， 如 果 
取消 成 功 了 ， 则 该 临界 资源 将 永远 处 于 锁定 状态 得 不 到 释放 。 外 界 取消 操作 是 不 可 预见 的 ， 因 此 的 
确 需要 一 个 机 制 来 简化 用 于 资源 释放 的 编程 , 也 就 是 需要 一 个 在 线程 退出 时 执行 清理 的 机 会 。 关于 
锁 后 面 会 讲 到 ， 这 里 只 需要 知道 谁 上 了 锁 ， 谁 就 要 负责 解锁 ， 否 则 会 引起 程序 死 锁 。 

我 们 来 看 一 个 场景 : 比如 线程 1 执行 这 样 一 段 代码 : 








void *threadl(void *arg) 
| pthread mutex lock(&mutex); // 上 锁 
// 调 用 某 个 阻塞 函数 ， 比 如 套 接 字 的 accept， 该 函数 等 待 客户 连接 
sock = accept(...... Na 
pthread mutex unlock(&mutex); 
) 
这 个 例子 中 ， 如 果 线 程 1 执行 accept， 线 程 就 会 阻塞 (也 就 是 等 在 那里 ， 有 客户 端 连接 的 时 候 
才 返 回 ， 或 者 出 现 其 他 故障 ) ， 现 在 线程 1 处 于 等 待 中 ， 这 时 线程 2 发 现 线程 1 等 了 很 入， 不 耐烦 
了 ， 它 想 关 掉 线 程 1， 于 是 调用 pthread cancel 或 者 类 似 函 数 ， 请 求 线程 1 立即 退出 。 这 时 线程 1 
仍然 在 accept 等 待 中 ， 当 它 收 到 线程 2 的 cancel 信号 后 ， 就 会 从 accept 中 退出 ， 然 后 终止 线程 ， 
但 是 这 个 时 候 线程 1 还 没有 执行 解锁 函数 pthread_mutex_unlock(&mutex);， 也 就 是 说 锁 资 源 没有 释 
放 ， 从 而 造成 其 他 线程 的 死 锁 问题 , 也 就 是 其 他 在 等 待 这 个 锁 资源 的 线程 将 永远 等 不 到 了 。 所 以 必 
须 在 线程 接收 到 cancel 后 ， 用 一 种 方法 来 保证 异常 退出 (也 就 是 线程 没 达到 终点 ) 时 可 以 做 清理 
工作 〈 主 要 是 解锁 方面 ) 。 
很 幸运 ，POSIX 线程 库 提供 了 函数 pthread_cleanup_push 和 pthread_cleanup_pop， 让 线程 退出 
时 可 以 做 一 些 清理 工作 。 这 两 个 函数 采用 先入 后 出 的 栈 结构 管理 , 前 者 会 把 一 个 函数 压 入 清理 函数 
栈 ， 后 者 用 来 弹出 栈 顶 的 清理 函数 ， 并 根据 参数 来 决定 是 否 执行 清理 函数 。 多 次 调用 函数 
pthread cleanup push 将 把 当前 在 栈 顶 的 清理 函数 往 下 压 ， 弹 出 清理 函数 时 ， 在 栈 顶 的 清理 函数 先 
被 弹出 。 栈 的 特点 是 先进 后 出 。pthread_cleanup_push 声明 如 下 : 


void pthread cleanup push(void (*routine) (void *), void *arg); 
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其 中 ， 参 数 routine 是 一 个 函数 指针 ，arg 是 该 函数 的 参数 。 由 pthread_cleanup_push 压 栈 的 清 
理 函 数 在 下 面 3 种 情况 下 会 执行 : 


CD 线程 主动 结束 时 ， 比 如 return 或 调用 pthread exit 的 时 候 。 
(2) 调用 函数 pthread_cleanup pop， 且 其 参数 为 非 0 时 。 
(3) 线程 被 其 他 线程 取消 时 ， 也 就 是 有 其 他 的 线程 对 该 线程 调用 pthread_cancel 函数 。 


函数 pthread_cleanup_pop 声明 如 下 : 
void pthread cleanup pop(int execute); 


其 中 ， 参 数 execute 用 来 决定 在 弹出 栈 顶 清理 函数 的 同时 是 否 执行 清理 函数 ， 取 0 时 表示 不 执 
行 清理 函数 , 非 0 时 则 执行 清理 函数 .要 注意 的 是 , 函数 pthread_cleanup_pop 与 pthread cleanup push 
必须 成 对 出 现在 同一 个 函数 中 ， 否 则 就 会 出 现 语法 错误 。 
了 解 这 两 个 函数 后 ， 我 们 可 以 把 上 面 可 能 会 引起 死 锁 的 线程 1 的 代码 改写 如 下 : 
void *threadl(void *arg) 
t 
pthread cleanup push(clean func,...) // 压 栈 一 个 清理 函数 clean func 
pthread mutex lock(&mutex); // 上 锁 
// 调 用 某 个 阻塞 函数 ， 比 如 套 接 字 的 accept， 该 函数 等 待 客户 连接 


Sock = accept(...... 有 


pthread mutex unlock(&mutex); // 解 锁 
pthread cleanup pop(0); // 弹 出 清理 函数 ， 但 不 执行 ， 因 为 参数 是 0 
return NULL; 

} 


在 上 面 的 代码 中 ， 如 果 accept 被 其 他 线程 cancel 后 线程 退出 ， 就 会 自动 调用 clean. func 函数 ， 
在 这 个 函数 中 可 以 释放 锁 资源 。 如 果 accept 没有 被 cancel， 那 么 线程 继续 执行 ， 当 执行 到 
“ pthread mutex unlock(&mutex); ”时 ， 表 示 线 程 自 己 正确 地 释放 资源 了 ， 再 执行 到 
“pthread_cleanup_pop(0);” 时 , 会 把 前 面 压 栈 的 清理 函数 clean. func 弹出 栈 , 并 且 不 会 去 执行 它 ( 因 
为 参数 是 0) 。 现 在 的 流程 就 安全 了 。 


【 例 8.17】 线 程 主动 结束 时 ， 调 用 清理 函数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <stdio.h> 

#include <stdlib.h> 

#include <pthread.h> 

#include <string.h> //strerror 


void mycleanfunc(void *arg) // 清 理 函 数 
f 
printf ("mycleanfunc:%d\n", *((int *)arg)); // 打 印 传 进来 的 不 同 参数 


) 
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void *thfruncl (void *arg) 


1 

int m-1; 

printf("thfruncl comes Nn"); 

pthread cleanup push(mycleanfunc, &m); // 把 清理 函数 压 栈 

return (void *)0; ”// 退 出 线程 

pthread cleanup pop(0); // 把 清理 函数 出 栈 ， 这 人 句 不 会 执行 ， 但 必须 有 ， 否 则 编译 不 过 
void *thfrunc2 (void *arg) 
{ 

int m= 2; 

printf("thfrunc2 comes \n"); 

pthread cleanup push(mycleanfunc, &m); // 把 清理 函数 压 栈 

pthread exit (0); // 退 出 线程 

pthread cleanup pop(0); // 把 清理 函数 出 栈 ， 这 句 不 会 执行 ， 但 必须 有 ， 和 否则 编译 不 过 


int main(void) 


pthread t pidl,pid2; 

int res; 

res = pthread create(&pidl, NULL, thfruncl, NULL); // 创 建 线程 1 

if (res) 

t 
printf("pthread create failed: $dWMn", strerror(res)); 
exit(1); 

) 

pthread join(pidl, NULL); // 等 待 线程 1 结束 


res = pthread create(&pid2, NULL, thfrunc2, NULL); // 创 建 线程 2 
if (res) 
{ 
printf("pthread create failed: $dWMn", strerror(res)); 
exit(1); 
} 
pthread join(pid2, NULL); // 等 待 线程 2 结束 


printf("main over\n"); 
return 0; 


) 
(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结 果 如 下 : 
[root@localhost cpp98]# g++ -o test test.cpp -lpthread 
[root@localhost cpp98]# ./test 


thfruncl comes 
mycleanfunc:1 
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thfrunc2 comes 

mycleanfunc:2 

main over 

从 例子 中 可 以 看 到 , 无 论 是 return 还 是 pthread. exit 都 会 引起 清理 函数 的 执行 。 值 得 注意 的 是 ， 
pthread cleanup pop 必须 和 pthread cleanup push 成 对 出 现在 同一 个 函数 中 ， 否 则 编译 不 过 ， 大 家 
可 以 把 pthread cleanup pop 注释 掉 后 再 编译 试 试 。 这 个 例子 是 线程 主动 调用 清理 函数 ， 下 面 我 们 
再 看 一 个 由 pthread_cleanup_pop 执行 清理 函数 的 例子 。 


【 例 8.18】pthread_cleanup_pop 调用 清理 函数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 








#include <stdio.h> 

#include <stdlib.h> 

#include <pthread.h> 

#include <string.h> //strerror 


void mycleanfunc(void *arg) // 清 理 函数 


{ 


} 


printf ("mycleanfunc:%d\n", *((int *)arg)); 


void *thfruncl(void *arg) // 线 程 函数 


( 


int 


int m-1,n-2; 

printf("thfruncl comes Wn"); 

pthread cleanup push(mycleanfunc, &m); // 把 清理 函数 压 栈 
pthread cleanup push(mycleanfunc, &n); // 再 把 一 个 清理 函数 压 栈 
pthread _ cleanup _pop (1) ;// 出 栈 清 理 函 数 ， 并 执行 

pthread exit (0) ; // 退 出 线程 

pthread cleanup pop(0); // 不 会 执行 ， 仅 为 了 成 对 


main(void) 


pthread t pidl ; 

int res; 

res = pthread create(&pidl, NULL, thfruncl, NULL); // 创 建 线程 

if (res) 

t 
printf("pthread create failed: $dWMn", strerror(res)); 
exit (1); 

) 

pthread join (pidl1，NULL) ;// 等 待 线程 结束 


printf("main OverNn") 
return 0; 
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(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost cpp98]# g++ -o test test.cpp -lpthread 

[root@localhost cpp98]# ./test 

thfruncl comes 

mycleanfunc:2 


mycleanfunc:1 
main over 


从 例子 中 可 以 看 出 , 我 们 连续 压 了 两 次 清理 函数 入 栈 ,第 一 次 压 栈 的 清理 函数 在 栈 底 , 第 二 次 
压 栈 的 清理 函数 就 到 栈 顶 了 ， 出 栈 的 时 候 应 该 是 第 二 次 压 栈 的 清理 函数 先 执行 ， 因 此 
“pthread_cleanup_pop(1);” 执 行 的 是 传 n 进去 的 清理 函数 ， 输 出 的 整数 值 应 该 是 2。pthread_exit 
退出 线程 时 ， 引 发 执行 的 清理 函数 是 传 m 进去 的 清理 函数 ， 输 出 的 整数 值 是 1。 下 面 再 看 最 后 一 
种 情况 ， 线 程 被 取消 时 引发 清理 函数 。 
【 例 8.19】 取 消 线程 时 引发 清理 函数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 





#include<stdio.h> 
#include<stdlib.h> 
#include <pthread.h> 
#include <unistd.h> //sleep 


void mycleanfunc(void *arg) // 清 理 函 数 


{ 
printf("mycleanfunc:$dNMn", *((int *)arg)); 


) 


void *thfunc(void *arg) 
t 


int i - 1; 


printf("thread start-------- Nn" 
pthread cleanup push(mycleanfunc, &i); // 把 清理 函数 压 栈 
while (1) 
t 
itt; 


printf("i-$dNn", i); 
1 
printf("this line will not runWin"); // 这 人 句 不 会 调用 
pthread cleanup pop(0); // 仅 仅 为 了 成 对 调用 


return (void *)0; 
} 
int main() 
t 
void *ret = NULL; 
int iret = 0; 
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pthread t tid; 
pthread create(&tid, NULL, thfunc, NULL); // 创 建 线程 
sleep(1); // 等 待 一 会 ， 让 子 线程 开始 whi le 循环 


pthread cancel (tid); // 发 送 取消 线程 的 请 求 

pthread join(tid, &ret); // 等 待 线程 结束 

if (ret == PTHREAD CANCELED) // 判 断 是 否 成 功 取消 线程 
printf("thread has stopped,and exit code: d\n", ret); 
// 打 印 返回 值 ， 应 该 是 -1 

else 
printf("some error occured"); 


return 0; 
) 
(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test tes.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 
[root@localhost cpp98]# g++ -o test test.cpp -lpthread 


[root@localhost cpp98]# ./test 
i=2 


i=24389i=24389 

mycleanfunc:24389 

thread has stopped,and exit code: -1 

从 这 个 例子 可 以 看 出 , 子 线程 在 循环 打印 i 的 值 , 一 直到 被 取消 。 由 于 循环 里 有 系统 调用 printf, 
因此 取消 成 功 。 取消 成 功 的 时 候 , 将 会 执行 清理 函数 , 在 清理 函数 中 打印 的 i 值 将 是 执行 很 多 次 itt 
后 的 i 值 ， 这 是 因为 我 们 压 栈 清理 函数 的 时 候 ， 传 给 清理 函数 的 是 i 的 地 址 ， 而 执行 清理 函数 的 时 
候 ，i 的 值 已 经 变 了 ， 因 此 打印 的 是 最 新 的 i 值 。 





8.4 C++11 中 的 线程 类 


前 面 讲 的 线程 是 利用 POSIX 线程 库 ， 这 是 传统 C/C++ 程序 员 使 用 线程 的 方式 。 现 在 在 CH+11 
中 ， 提 供 了 语言 层面 使 用 线程 的 方式 。 
C++ll 新 标准 中 引入 了 5 个 头 文件 来 支持 多 线程 编程 ， 分 别 是 atomic, thread, mutex, 


condition_variable 和 future。 
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€ atomic: 该 头 文件 主要 声明 了 两 个 类 ， 即 std::atomic 和 std::atomic flag， 另 外 还 声明 
了 一 套 C 风格 的 原子 类 型 和 与 C 兼容 的 原子 操作 的 函数 。 

€ thread: 该 头 文件 主要 声明 了 std::thread X, 3 4| std::this thread. 命名 空间 也 在 该 头 
xtv. 

€ mutex: 该 头 文件 主要 声明 了 与 互 斥 锁 (mutex) 相关 的 类 ， 包 括 std::mutex 系列 类 、 
std::lock guard. std::unique lock 以 及 其 他 的 类 型 和 函数 。 

€ condition variable: 该 头 文件 主要 声明 了 与 条 件 变 量 相关 的 类 ， 包 括 
std::condition_variable 和 std::condition variable any. 

€ future: 该 头 文件 主要 声明 了 std:promise. std:package task 两 个 Provider 类 ， 以 及 
std::future 和 std::shared_future 两 个 Future 类 ， 另 外 还 有 一 些 与 之 相关 的 类 型 和 函 
数 ，std::async 函数 就 声明 在 此 头 文件 中 。 


显然 ，std::thread 类 是 非常 重要 的 类 ， 下 面 我 们 来 概览 一 下 这 个 类 的 成 员 ， 类 std::thread 的 常 
用 成 员 函 数 如 表 8-2 所 示 。 


表 8-2 类 std::thread 的 常用 成 员 函 数 
| reaa 有 
判断 线程 对 象 是 否 可 连接 


join 阻塞 函数 ， 等 待 线程 结束 
native handle 用 于 获得 与 操作 系统 相关 的 原生 线程 句柄 (需要 本 地 库 支持 ) 





8.4.1 线程 的 创建 


在 C++1l 中 ,创建 线程 的 方式 是 使 用 类 std::thread 的 构造 函数 ，std::thread 在 #include<thread> 
头 文件 中 声明 ， 因 此 使 用 std::thread 时 需要 包含 头 文件 thread， 即 #include <thread>。std::thread 的 
构造 函数 有 3 种 形式 : 不 带 参数 的 默认 构造 函数 、 初 始 化 构造 函数 、 移 动 构造 函数 。 

虽然 类 thread 的 初始 化 可 以 提供 很 丰富 和 方便 的 形式 ， 其 实现 的 底层 依然 是 创建 一 个 pthread 
线程 并 运行 ， 有 些 实现 甚至 是 直接 调用 pthread create 来 创建 。 

1. 默认 构造 函数 

默认 构造 函数 是 不 带 参数 的 ， 声 明 如 下 : 

thread(); 


刚 定 义 默 认 构 造 函数 的 thread 对 象 ， 其 线程 是 不 会 马上 运行 的 。 
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【 例 8.20】 批 量 创 建 线程 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <stdio.h> 
#include «stdlib.h» 


#include <chrono> // std::chrono::seconds 
#include <iostream> // std::cout 
#include «thread» // std::thread, std::this thread::sleep for 
using namespace std; 
void thfunc(int n) // 线 程 函数 
t 
std: :cout << "thfunc:" «« n «« endl; 


) 


int main(int argc, const char *argv[]) 
t 
std::thread threads[5]; // 批 量 定义 5 个 thread 对 象 ， 但 此 时 并 不 会 执行 线程 
std::cout << "create 5 threads... Mn"; 
for (int X = 0; i < 5; itt) 
threads[i] = std::thread(thfunc, i + 1); // 这 里 开始 执行 线程 函数 thfunc 


for (auto& t : threads) // 等 待 每 个 线程 结束 


t.join(); 
std::cout << "All threads joined. n"; 


return EXIT SUCCESS; 
) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -Ipthread -std=c++11” , 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 
[rootélocalhost test]# ./test 

create 5 threads... 

thfunc:5 

thfunc:1 

thfunc:2 

thfunc:3 

thfunc:4 

All threads joined. 


上 例 定义 了 5 个 线程 对 象 , 刚 定义 的 时 候 并 不 会 执行 线程 ， 然 后 将 另外 初始 化 构造 函数 〈 后 面 
会 讲 到 ) 的 返回 值 赋 给 它们 。 创 建 的 线程 都 是 可 连接 线程 ， 所 以 要 用 join 来 等 待 它们 结束 。 这 个 
函数 后 面 也 会 讲 到 。 多 执行 几 次 这 个 程序 , 就 可 以 发 现 其 打印 的 次 序 并 不 是 每 次 都 一 样 , 这 与 CPU 
的 调度 有 关 。 
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2. 初始 化 构造 函数 

这 里 所 说 的 初始 化 构造 函数 的 意思 是 把 线程 函数 的 指针 和 线程 函数 的 参数 RA) 都 传 入 
线程 类 的 构造 函数 中 。 这 种 形式 最 常用 ， 由 于 传 入 了 线程 函数 ， 因 此 定义 线程 对 象 的 时 候 ， 就 会 开 
始 执行 线程 函数 ， 如 果 线 程 函 数 需 要 参数 ， 可 以 在 构造 函数 中 传 入 。 初 始 化 构造 函数 的 形式 如 下 : 


template «class Fn, class... Args» 
explicit thread (Fn&& fn, Args&&... args); 


其 中 ，fn 是 线程 函数 指针 ; args 是 可 选 的 ， 是 要 传 入 线程 函数 的 参数 。 线 程 对 象 定义 后 ， 主 
线程 会 继续 执行 后 面 的 代码 ,这 就 可 能 会 出 现 创建 的 子 线程 还 没 执行 完 ， 主 线程 就 结束 了 ， 比 如 控 
制 台 程序 ， 主 线程 结束 意味 着 进程 就 结束 了 。 在 这 种 情况 下 ,我们 需要 让 主线 程 等 待 ， 等 待 子 线程 
全 部 运行 结束 后 再 继续 执行 主线 程 。 还 有 一 种 情况 ,主线 程 为 了 统计 各 个 子 线程 工作 的 结果 而 需要 
等 待 子 线程 结束 后 再 继续 执行 ， 此 时 主线 程 就 要 等 待 了 。 类 thread 提供 了 成 员 函 数 join 来 等 待 子 
线程 结束 ， 即 子 线程 的 线程 函数 执行 完毕 后 ，join 才 返 回 ， 因 此 join 是 一 个 阻塞 函数 。 函 数 join 
会 让 主线 程 挂 起 〈 休 眠 ， 就 是 让 出 CPU) ， 直 到 子 线程 都 退出 ， 同 时 join 能 让 子 线程 所 占 的 资源 
得 到 释放 。 子 线程 退出 后 ， 主 线程 会 接收 到 系统 的 信号 ， 从 休眠 中 恢复 。 这 一 过 程 和 POSIX 类 似 ， 
只 是 函数 形式 不 同 而 已 ， 大 家 有 了 POSIX 线程 方面 的 基础 ， 理 解 这 里 的 内 容 应 该 不 难 。 成 员 函 数 
join 声明 如 下 : 








void join(); 


值得 注意 的 是 ， 这 样 创建 的 线程 是 可 连接 线程 ， 因 此 线程 对 象 必须 在 销毁 时 调用 join 函数 ， 
或 者 将 其 设置 为 可 分 离 的 。 
下 面 我 们 来 看 一 个 通过 初始 化 构造 函数 来 创建 线程 的 例子 。 


【 例 8.21】 创 建 一 个 线程 ， 不 传 参数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> 

#include <thread> 

#include <unistd.h> //sleep 

using namespace std; // 使 用 命名 空间 std 


void thfunc() // 子 线程 的 线程 函数 
t 

cout «« "i am c++11 thread func" «« endl; 
ih 


int main(int argc, char *argv[]) 

t 
thread t(thfunc); // 定 义 线程 对 象 ， 并 把 线程 函数 指针 传 入 
sleep(1); //main 线 程 挂 起 1 秒 钟 ， 为 了 让 子 线程 有 机 会 执行 


return 0; 
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(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -Ipthread -std=c++11” , 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost ch08-2]# g++ -o test test.cpp -lpthread -std=c++11 

[root@localhost ch08-2]4 ./test 

i am c++11 thread func 

值得 注意 的 是 , 编译 C++11 代码 的 时 候 ， 要 加 上 编译 命令 函数 “-std=ct+11”。 在 这 个 例子 中 ， 
首先 定义 一 个 线程 对 象 , 定义 对 象 后 马上 会 执行 传 入 构造 函数 的 线程 函数 , 线程 函数 中 打印 一 行 字 
符 串 后 结束 ,而 主线 程 在 创建 子 线程 后 ,会 等 待 一 秒 后 再 结束 , 这 样 不 至 于 因为 主线 程 的 过 早 结束 
而 导致 进程 结束 ， 进 程 结 束 后 子 线程 就 没有 机 会 执行 了 。 如 果 没 有 等 待 函数 sleep， 则 可 能 子 线程 
的 线程 函数 还 没 来 得 及 执行 ， 主 线程 就 结束 了 ， 这 样 导 致 子 线程 的 线程 都 没有 机 会 执行 ,因为 主线 
程 已 经 结束 ， 整 个 应 用 程序 已 经 退出 了 。 
【 例 8.22】 创 建 一 个 线程 ， 并 传 入 整 型 参数 

(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> 
#include <thread> 
using namespace std; 


void thfunc(int n) // 线 程 函 数 
{ 
cout << "thfunc: " << n << "An";  // 这 里 的 n 是 1 


} 


int main(int argc, char *argv[]) 
t 
thread t(thfunc,1); // 定 义 线程 对 象 t， 并 把 线程 函数 指针 和 线程 函数 参数 传 入 


t.joinO; // 等 待 线程 对 象 t 结 束 


return 0; 

) 

(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test tes.cpp -Ipthread -std=c++11”， 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 

[root@localhost test]# ./test 

thfunc: 1 

这 个 例子 和 上 一 个 例子 有 两 点 不 同 , 一 点 是 创建 线程 的 时 候 , 把 一 个 整数 作为 参数 传 给 构造 函 
数 ， 另 一 点 是 等 待 子 线程 结束 没有 用 sleep 函数 ， 而 是 用 join. sleep 只 是 等 待 一 个 固定 的 时 间 ， 有 
可 能 在 这 个 固定 的 时 间 内 ，, 子 线程 早已 经 结束 , 或 者 子 线程 运行 的 时 间 大 于 这 个 固定 时 间 , 因此 用 
它 来 等 待 子 线程 结束 并 不 精确 ， 而 用 函数 join 则 会 一 直 等 到 子 线程 结束 后 才 会 执行 该 函数 后 面 的 
代码 。 
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【 例 8.23】 创 建 一 个 线程 ， 并 传递 字符 串 作 为 参数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 
#include <iostream> 


#include <thread> 
using namespace std; 


void thfunc(char *s) // 线 程 函 数 
{ 


cout << "thfunc: " ««s << "\n";  // 这 里 s 就 是 poy and girl 


} 


int main(int argc, char *argv[]) 

t 
char s[] = "boy and girl"; // 定 义 一 个 字符 串 
thread t(thfunc,s); // 定 义 线程 对 象 ， 并 传 入 字符 串 s 
t.joinO; ”// 等 待 t 执 行 结束 


return 0; 


) 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -Ipthread -std=c++11” , 


其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 


[rootélocalhost test]# ./test 
thfunc: boy and girl 


【 例 8.24】 创 建 一 个 线程 ， 并 传递 结构 体 作 为 参数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> 
#include <thread> 
using namespace std; 


typedef struct // 定 义 结构 体 的 类 型 
{ 


int n; 
const char *str; // 注 意 这 里 要 有 const， 否 则 会 有 警告 
)MYSTRUCT; 


void thfunc (void *arg) // 线 程 函数 
t 
MYSTRUCT *p - (MYSTRUCT*)arg; 


cout << "in thfunc:n-" << p-»n««",str-"«« p-»str ««endl; // 打 印 结构 体 的 内 容 


) 


int main(int argc, char *argv[l]) 
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MYSTRUCT mystruct; // 定 义 结构 体 


// 初 始 化 结构 体 
mystruct.n = 110; 
mystruct.str = "hello world"; 


thread t(thfunc, &mystruct); // 定 义 线程 对 象 t， 并 把 结构 体 变量 的 地 址 传 入 
t.join(); // 等 待 线程 对 象 t 结 束 


return 0; 

} 

(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread -std=c++11” , 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 

[root@localhost test]# ./test 

in thfunc:n=110,str=hello world 

通过 结构 体 把 多 个 值 传 给 了 线程 函数 , 现在 不 用 结构 体 作为 载体 , 直接 把 多 个 值 通 过 构造 函数 
来 传 给 线程 函数 ， 其 中 有 一 个 参数 是 指针 ， 我 们 在 线程 中 修改 其 值 。 


【 例 8.25】 创 建 一 个 线程 ， 传 多 个 参数 给 线程 函数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> 
#include <thread> 
using namespace std; 


void thfunc (int n,int m,int *pk,char s[]) // 线 程 函 数 
{ 


cout << "in thfunc:n-" ««n««",m-"««m««",k-"««* pk <<"\nstr="<<s<<endl; 
*pk = 5000; // 修 改 * pk 


int main(int argc, char *argv[]) 


int n = 110,m-200,k-5; 
char str[] = "hello world"; 


thread t(thfunc, n,m,&k,str); // 定 义 线程 对 象 t， 并 传 入 多 个 参数 
t.joinQ; // 等 待 线 程 对 象 t 结 束 
cout << "k=" << k << endl; // 此 时 应 该 打印 5000 


return 0; 


} 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread -std=c++11”， 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 
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[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 
[root@localhost test]# ./test 

in thfunc:n=110,m=200, k=5 

str=hello world 

k=5000 


这 个 例子 中 , 我 们 传 入 了 多 个 参数 给 构造 函数 ， 这 样 线程 函数 也 要 准备 多 样 的 形 参 , 并且 其 中 
一 个 是 整 型 地 址 〈&k) ， 我 们 在 线程 中 修改 了 它 所 指 变量 的 内 容 ， 等 子 线程 结束 后 ， 再 在 主线 程 





中 打印 k， 发 现 它 的 值 变 了 。 


前 面 提 到 ， 默 认 创建 的 线程 都 是 可 连接 线程 ， 可 连接 线程 需要 调用 join 函数 来 等 竺 其 结束 





释放 资源 。 前 面 的 例子 用 了 join 函数 来 等 待 其 结束 。 除 了 使 用 join 方式 来 等 待 结束 外 ， 还 可 以 把 
可 连接 线程 进行 分 离 ， 即 调用 detach 成 员 函 数 。 变 成 可 分 离线 程 ， 线 程 自己 结束 后 就 可 以 被 系统 
自动 回收 资源 了 。 而 且 主 线程 并 不 需要 等 待 子 线程 结束 ， 主 线程 可 以 自己 先 结束 。 将 线程 进行 分 离 





的 成 员 函 数 是 detach， 形 式 如 下 : 
void detach(); 
【 例 8.26】 把 可 连接 线程 转 为 分 离线 程 ( C++11 和 POSIX 联合 作战 ) 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> 

#include <thread> 

using namespace std; 

void thfunc(int n,int m,int *k,char s[]) // 线 程 函数 

t 
cout << "in thfunc:n-" ««n««",m-"««m««", k-"««*k««"Anstr-"««s««endl; 
*k = 5000; 


int main(int argc, char *argv[]) 


int n = 110,m-200,k-5; 
char str[] = "hello world"; 


thread t(thfunc, n,m,&k,str);  // 定 义 线程 对 象 
t.detach(); // 分 离线 程 


cout << "k=" << k << endl; // 这 里 输出 3 
pthread exit (NULL); //main 线 程 结 束 ， 但 进程 并 不 会 结束 ， 下 面 一 句 不 会 执行 


cout << "this line will not run"«« endl; // 这 一 句 不 会 执行 
return 0; 


) 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test tes.cpp -Ipthread -std=c++11”， 


其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 
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[rootélocalhost test]# ./test 
k-5 

in thfunc:n-110,m-200,k-5 
str-hello world 


在 这 个 例子 中 ， 我 们 调用 detach 来 分 离线 程 ， 这 样 主线 程 可 以 不 用 等 子 线程 结束 而 自己 先 结 
束 。 为 了 展示 效果 ， 我 们 在 主线 程 中 调用 了 pthread_exit(NULL); 来 结束 主线 程 ， 前 面 提 到 过 ， 在 
main 线程 中 调用 pthread_exit(NULL); 的 时 候 ， 将 结束 main 线程 ， 但 进程 并 不 立即 退出 ， 要 等 所 有 
的 线程 全 部 结束 后 才 会 结束 ， 所 以 我 们 能 看 到 子 线程 函数 打印 的 内 容 。 主 线程 中 会 先 打印 k， 这 是 
因为 打印 k 的 时 候 线程 还 没有 切换 。 从 这 个 例子 也 可 以 看 出 ，C++11 可 以 和 POSIX 联合 作战 ， 充 











分 体现 了 C++ 程序 的 强大 威力 。 
3. 移动 ( move ) 构造 函数 


构造 函数 中 传 入 一 个 C++ 对 象 来 创建 线程 。 这 种 形式 的 构造 函数 定义 如 下 : 
thread (thread&& x); 
调用 成 功 之 后 ，x 不 代表 任何 thread 对 象 。 
【 例 8.27】 通 过 移动 构造 函数 来 启动 线程 
A) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> 
#include <thread> 


using namespace std; 


void fun(int & n) // 线 程 函 数 
{ 
COG <e nfun LS LS Nn 
n += 20; 
this thread::sleep for(chrono::milliseconds(10));  // 等 待 10 毫 秒 
int main() 
ü 


int n = 0; 


Cout «« "ne" «ec n «« Nn 


n - 10; 
thread tl(fun, ref(n)); //ref(n) 是 取 n 的 引用 
thread t2 (move (t1)); //t2 执 行 fun，t1 不 是 thread 对 象 


t2.join(); // 等 待 t2 执 行 完毕 
COUE ec nz" ee nee TN 
return 0; 


) 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test tes.cpp -Ipthread -std=c++11” , 
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其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[rootGlocalhost test]# g++ -o test test.cpp -lpthread -std=c++11 
[rootélocalhost test]# ./test 

n=0 

fun: 10 

n=30 


从 这 个 例子 可 以 看 出 ，tl 并 不 会 执行 ， 执 行 的 是 2, AA tl 的 线程 函数 移动 给 已 了 。 


8.4.2 ”线程 的 标识 符 

线程 的 标识 符 AD) 可 以 用 来 唯一 标识 某 个 thread 对 象 所 对 应 的 线程 ， 这 样 可 以 用 来 区 别 不 
同 的 线程 。 两 个 标识 符 相同 的 thread 对 象 ， 所 代表 的 线程 是 同一 个 线程 , 或 者 代表 这 两 个 对 象 都 还 
没有 线程 。 两 个 标识 符 不 同 的 thread 对 象 代表 着 不 同 的 线程 ， 或 者 一 个 thread 对 象 已 经 有 线程 了 ， 
另 一 个 还 没有 。 

类 thread 提供 了 成 员 函 数 getid 来 获取 线程 ID， 该 函数 声明 如 下 : 

thread::id get id() 


其 中 ，id 是 线程 标识 符 的 类 型 ， 它 是 类 thread 的 成 员 ， 用 来 唯一 标识 某 个 线程 。 
有 时 候 ， 为 了 查看 两 个 thread 对 象 的 ID 是 否 相 同 ， 可 以 在 调试 的 时 候 把 ID 打印 出 来 查看 ， 
它们 的 数值 虽然 没什么 含义 ， 但 却 可 以 比较 是 否 相同 ， 也 是 为 调试 做 出 了 贡献 。 


【 例 8.28】 线 程 比较 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> // std::cout 

#include «thread» // std::thread, std::thread::id, 
std: :this thread::get id 

using namespace std; 


thread::id main thread id = this thread::get id(); // 获 取 主 线程 id 


void is main thread() 
t 
if (main thread id == this thread::get id()) // 判 断 是 否 和 主线 程 id 相同 
std::cout << "This is the main thread.\n"; 
else 
std::cout << "This is not the main thread.\n"; 


int main() 


is main thread(); // is main thread 作为 main 线 程 的 普通 函数 调用 
thread th(is main thread); // is main thread 作 为 线程 函数 使 用 
th.join () ; // 等 待 th 结束 


return 0; 
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} 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -Ipthread -std=c++11” , 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 
[root@localhost test]# ./test 


This is the main thread. 
This is not the main thread. 


Elt, is main thread 第 一 次 使 用 时 是 main 线程 中 的 普通 函数 ， 得 到 的 ID 肯定 和 
main thread id 相同 。 第 二 次 是 作为 一 个 子 线程 的 线程 函数 ， 此 时 得 到 的 ID 是 子 线程 的 ID， 和 
main thread id 就 不 同 了 。this_thread 是 一 个 命名 空间 (namespace) ， 用 来 表示 当前 线程 ， 主 要 作 
用 是 集合 一 些 函数 来 访问 当前 线程 ， 一 共有 4 PAZ get id. yield. sleep until, sleep for. 


8.4.3 ”当前 线程 this_thread 
在 实际 线程 开发 中 ， 经 常 需要 访问 当前 线程 。 C++11 提供 了 一 个 命名 空间 this_thread 来 引用 


当前 线程 ， 该 命名 空间 集合 了 4 个 有 用 的 函数 ，get_id、yield、sleep_until、sleep_for。 函 数 get id 
和 类 thread 的 成 员 函 数 get. id 是 同一 个 意思 ， 都 是 用 来 获取 线程 ID 的 。 


1. 让 出 CPU 时 间 
调用 函数 yield 的 线程 将 让 出 自己 的 CPU 时 间 片 ， 以 便 其 他 线程 有 机 会 运行 ， 声 明 如 下 : 





void yield(); 
调用 该 函数 的 线程 放弃 执行 ， 回 到 就 绪 态 。 只 看 这 个 函数 似乎 有 点 抽象 , 我 们 通过 一 个 例子 来 
说 明 该 函数 的 作用 。 创 建 10 个 线程 ， 每 个 线程 中 让 一 个 变量 从 一 累加 到 一 百 万 ， 谁 先 完成 就 打印 
它 的 编号 ， 以 此 排名 。 为 了 公平 起 见 ， 创 建 线程 的 时 候 ， 先 不 让 它们 占用 CPU 时 间 ， 一 直到 main 
线程 改变 全 局 变量 值 ， 各 个 子 线程 才 一 起 开始 累加 。 
【 例 8.29】 线 程 赛跑 排名 次 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> // std::cout 
#include «thread» // std::thread, std::this thread::yield 
#include «atomic» // std::atomic 


using namespace std; 

atomic«bool» ready(false); // 定 义 全 局 变量 

void thfunc (int id) 

while (!ready) // 一 直 等 待 ， 直 到 main 线 程 中 重 置 全 局 变量 ready 
this thread::yield(); // 让 出 自己 的 CPU 时 间 片 


for (volatile int i = 0; i < 1000000; ++i) // 开 始 累 加 到 一 百 万 
{} 
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cout << id<<",";// 累 加 完毕 后 ， 打 印 本 线程 的 序号 ， 这 样 最 终 输 出 的 是 排名 ， 先 完成 先 打印 


int main() 


thread threads[10]; // 定 义 10 个 线程 对 象 
cout << "race of 10 threads that count to 1 million: in"; 
for (int i = 0; i < 10; ++i) 

threads[i] = thread(thfunc, i); 

// 启 动 线程 ， 把 i 当 作 参数 传 入 线程 函数 ， 用 于 标记 线程 的 序号 
ready = true; // 重 置 全 局 变量 
for (auto& th : threads) th.join() ; // 等 待 10 个 线程 全 部 结束 
cout << 'An'; 


return 0; 

) 

(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test testcpp -Ipthread -std=c++11” , 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 

[root@localhost test]# ./test 

race of 10 threads that count to 1 million: 

9,4,5,0,1,2,6,7,8,3, 

如 果 多 次 运行 此 例 ， 每 次 结果 是 不 同 的 。 线 程 刚刚 启动 的 时 候 ， 一 直 在 while 循环 中 让 出 自己 
的 CPU 时 间 ， 这 就 是 函数 yield 的 作用 ，this_thread 在 子 线程 中 使 用 ， 代 表 这 个 子 线程 本 身 。 一 旦 
跳出 while， 就 开始 累加 ， 一 直到 一 百 万 ， 最 后 输出 序号 ， 全 部 序号 都 输出 后 ， 得 到 的 结果 是 先 跑 
完 一 百 万 的 排名 。atomic 用 来 定义 在 全 局 变量 ready 上 的 操作 都 是 原子 操作 ， 原 子 操作 (后面 章节 
会 讲 到 ) 表示 在 多 个 线程 访问 同一 个 全 局 资源 的 时 候 , 能 够 确保 所 有 其 他 的 线程 都 不 在 同一 时 间 内 
访问 相同 的 资源 。 也 就 是 它 确保 了 在 同一 时 刻 只 有 唯一 的 线程 对 这 个 资源 进行 访问 。 这 有 点 类 似 互 
斥 对 象 对 共享 资源 访问 的 保护 ， 但 是 原子 操作 更 加 接近 底层 ， 因 而 效率 更 高 。 

2. 让 线程 暂停 一 段 时 间 

命名 空间 this thread 还 有 2 个 函数 ， 即 sleep_until、sleep_for， 用 来 阻塞 线程 ， 暂 停 执行 一 段 
时 间 。 函 数 sleep until 声明 如 下 : 


template «class Clock, class Duration» 
void sleep until (const chrono::time point«Clock,Duration»& abs time); 


其 中 ， 参 数 abs_time 表示 函数 阻塞 线程 到 abs. time 时 间 点 ， 到 了 这 个 时 间 点 后 再 继续 执行 。 
函数 sleep for 的 功能 类 似 ， 只 是 它 是 挂 起 线程 一 段 时 间 ， 时 间 长 度 由 参数 决定 ， 声 明 如 下 : 


template «class Rep, class Period» 
void sleep for (const chrono::duration«Rep,Period»& rel time); 


其 中 ， 参 数 rel_time 表示 线程 挂 起 的 时 间 段 ， 在 这 段 时 间 内 线程 暂停 执行 。 
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下 面 我 们 来 看 两 个 小 例子 ， 加 深 一 下 对 这 两 个 函数 的 至 
【 例 8.30】 和 暂停 线程 到 下 一 分 钟 


EAE. 


(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> // std::cout 

#include «thread» // std::this thread::sleep until 

#include «chrono» // std::chrono::system clock 

#include «ctime» // std::time t, std::tm, std::localtime, std 


#include «time.h» 
#include «stddef.h» 
using namespace std; 


void getNowTime() // 获 取 并 打印 当前 时 间 
{ 

timespec time; 

struct tm nowTime; 


clock gettime (CLOCK REALTIME, &time); // 获 取 相对 于 1970 到 现在 的 秒 数 


localtime r(&time.tv sec, &nowTime); 
char current[1024]; 
printf( 
"$04d-$02d-$02d $02d:$02d:$02dWn", 
nowTime.tm year + 1900, 
nowTime.tm mon+1, 
nowTime.tm mday, 
nowTime.tm hour, 
nowTime.tm min, 
nowTime.tm sec); 


int main() 


using std::chrono::system clock; 


std: :time t tt = system clock::to time t(system clock::now()); 
struct std::tm * ptm = std::localtime(&tt); 


getNowTime () ;// 打 印 当 前 时 间 

cout << "Waiting for the next minute to 
++ptm->tm min; // 累 加 一 分 钟 

ptm-»tm sec = 0;// 秒 数 置 0 


begin...\n"; 


::mktime 


this thread::sleep until(system clock::from time t (mktime (ptm))); 


// 暂 停 执 行 到 下 一 个 整 分 时 间 
getNowTime(); // 打 印 当前 时 间 


return 0; 


} 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread -std=c++11”， 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 





多 线程 基本 编程 第 8 党 





[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 
[root@localhost test]# ./test 

2Z0tI=10=05 13:02:31 

Waiting for the next minute to begin... 

20i 0T-10205913:03:00 


上 例 中 ，main 线程 从 sleep_until 处 开始 挂 起 ， 然 后 到 下 一 个 整 分 时 间 (就 是 分 钟 加 1， 秒 钟 为 
0) 再 继续 执行 。 


【 例 8.31】 暂停 线 程 5 秒 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> // std::cout, std::endl 
#include «thread» // std::this thread::sleep for 
#include «chrono» // std::chrono: :seconds 

int main() 


( 


std::cout << "countdown: Mn"; 
Tor (ine i= Sp 1 > 07 ——1y 


t 
std::cout << i << std::endl; 
std: :this_thread: :sleep for(std: :chrono::seconds(1)); // 暂 停 一 秒 


) 
std::cout << "Lift off!Nn"; 


return 0; 
) 
(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test testcpp -Ipthread -std=c++11” , 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 
[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 


[root@localhost test]# ./test 


countdown: 
5 


PONO 


Lift off! 


程序 很 简单 ， 无 须 多 言 。 


第 9 章 多 线程 高 级 编程 


第 8 章 讲 述 了 多 线程 的 一 些 基本 概念 和 基本 操作 ， 比 如 创建 、 结 束 等 。 这 一 章 我 们 将 讲述 线 
程 开发 的 一 些 高 级 话题 ， 比 如 多 线程 编程 模型 、 线 程 同 步 等 。 

在 多 线程 编程 中 ， 线 程 间 是 相互 独立 而 又 相互 依赖 的 ， 所 有 的 线程 都 是 并 发 、 并 行 并 且 是 异 
步 执行 的 。 多 线程 编程 提供 了 一 种 新 型 的 模块 化 编程 思想 和 方法 。 这 种 方法 能 清晰 地 表达 各 种 独立 
事件 的 相互 关系 , 但 是 多 线程 编程 也 带 来 了 一 定 的 复杂 度 : 并 发 和 异步 机 制 带 来 了 线程 间 资源 竞争 
的 无 序 性 。 因 此 , 我 们 需要 引入 同步 机 制 来 消除 这 种 复杂 度 并 实现 线程 间 的 数据 共享 ， 以 一 致 的 顺 
序 执 行 一 组 操作 。 如 何 使 用 同步 机 制 来 消除 线程 并 发 、 并 行 和 异步 执行 而 带 来 的 复杂 度 是 多 线程 编 
程 中 的 核心 问题 。 





9.1 多 线程 的 同步 和 异步 


多 个 线程 可 能 在 同一 时 间 对 同一 共享 资源 进行 操作 ， 其 结果 是 某 个 线程 无 法 获得 资源 ， 或 者 
会 导致 资源 的 破坏 。 为 保证 共享 资源 的 稳定 性 , 需要 采用 线程 同步 机 制 来 调整 多 个 线程 的 执行 顺序 ， 
比如 可 以 用 一 把 “ 锁 ”， 一 旦 某 个 线程 获得 了 锁 的 拥有 权 ， 即 可 保证 只 有 它 〈 拥 有 锁 的 线程 ) 才能 
对 共享 资源 进行 操作 。 同 样 ， 利 用 这 个 锁 ， 其 他 线程 可 一 直 处 于 等 待 状态 ， 直 到 锁 没有 被 任何 线程 
拥有 为 止 。 

异步 是 当 一 个 调用 或 请 求 发 给 被 调用 者 时 ， 调 用 者 不 用 等 待 其 结果 的 返回 而 继续 当前 的 处 理 。 
实现 异步 机 制 的 方式 有 多 线程 、 中 断 和 消息 等 。 也 就 是 说 ， 多 线程 是 实现 异步 的 一 种 方式 。C++11 
对 异步 的 支持 丝毫 不 弱 。 








92 ”线程 同步 


并 发 和 异步 机 制 带 来 了 线程 间 资源 竞争 的 无 序 性 。 因 此 需要 引入 同步 机 制 来 消除 这 种 复杂 度 
实现 线程 间 正 确 有 序 共享 数据 ， 以 一 致 的 顺序 执行 一 组 操作 。 

线程 同步 是 多 线程 编程 中 的 重要 概念 。 它 的 基本 思想 是 同步 各 个 线程 对 资源 (比如 全 局 变量 、 
文件 ) 的 访问 。 如 果 不 对 资源 访问 进行 线程 同步 , 则 会 产生 资源 访问 冲突 的 问题 。 对 于 多 线程 程序 ， 
访问 冲突 的 问题 是 很 普遍 的 ， 解 决 的 办 法 是 引入 锁 〈 比 如 互 斥 锁 、 读 写 锁 等 ) ， 获 得 锁 的 线程 可 以 
完成 “ 读 -修改 - 写 ” 的 操作 ， 然 后 释放 锁 给 其 他 线程 ， 没 有 获得 锁 的 线程 只 能 等 待 而 不 能 访问 共享 
数据 ， 这 样 “ 读 -修改 - 写 ”3 步 操作 组 成 一 个 原子 操作 ， 要 么 都 执行 ， 要 么 都 不 执行 ， 不 会 执行 到 
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中 间 被 打 断 ， 也 不 会 在 其 他 处 理 器 上 并 行 做 这 个 操作 。 

比如 ， 一 个 线程 正在 读 取 一 个 全 局 变量 ， 虽 然 读 取 全 局 变量 的 这 个 语句 在 C/C++ 源 代码 中 是 
一 条 语句 ， 但 编译 为 机 器 代码 后 ，CPU 指令 处 理 这 个 过 程 的 时 候 ， 需 要 用 多 条 指令 来 处 理 这 个 读 
取 变 量 的 过 程 ， 如 果 这 一 系列 指令 被 另 一 个 线程 打 断 了 ， 也 就 是 说 CPU 还 没 执行 完全 部 读 取 变 量 
的 所 有 指令 ， 而 去 执行 另 一 个 线程 了 ， 另 一 个 线程 却 要 对 这 个 全 局 变量 进行 修改 ,这 样 修 改 完 后 又 
返回 原先 的 线程 ， 继 续 执行 读 取 变 量 的 指令 ， 此 时 变量 的 值 已 经 改变 了 ， 这 样 第 一 个 线程 的 执行 结 
果 就 不 是 预料 的 结果 了 。 

我 们 来 看 一 个 对 于 多 线程 访问 共享 变量 造成 竞争 的 例子 ， 假 设 增 量 操作 分 为 以 下 3 个 步骤 


CD. 从 内 存单 元 读 入 寄存 器 。 
(2) 在 寄存 器 中 进行 变量 值 的 增加 。 
G) 把 新 的 值 写 回 内 存单 元 。 


那么 当 两 个 线程 对 同一 个 变量 做 增 操作 时 ， 就 可 能 出 现 如 图 9-1 所 示 的 情况 。 



























































线程 A 线程 B i 的 内 容 
读 取 i 放 入 5 
寄存 器 
(register=5) 
寄存 器 内 容 加 1 BRIKA 
jis 寄存 器 5 
dye (register-5) 
雪 存 器 的 丙 
REA lá trssy mt " 
(register=6) (register-6) 
EFENA | 
&55 Bli 6 
(register=6) 
图 9-1 


如 果 两 个 线程 在 串 行 操作 下 分 别 对 i 进行 了 累加 ， 那 么 i 的 值 就 应 该 是 7 了 ， 但 图 9-1 的 两 个 
线程 执行 后 的 i 值 是 6。 因 为 B 线程 并 没有 等 A 线程 做 完 itl 后 开始 执行 ,而 是 A 线程 刚刚 把 i 从 
内 存 读 入 寄存 器 后 就 开始 执行 了 , 所 以 B 线程 也 是 在 i=5 的 时 候 开始 执行 ,这样 A 执行 的 结果 是 6， 
B 执行 的 结果 也 是 6。 因 此 在 这 种 没有 做 同步 的 情况 下 ， 多 个 线程 对 全 局 变量 进行 累加 ， 最 终结 果 
是 小 于 或 等 于 它们 的 串 行 操作 结果 的 。 请 看 下 例 。 


【 例 9.1】 不 用 线程 同步 的 多 线程 票 加 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <stdio.h> 
#include <unistd.h> 
#include <pthread.h> 
#include <sys/time.h> 
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#include <string.h> 
#include <cstdlib> 


int gcn = 0; // 定 义 一 个 全 局 变量 ， 用 于 累加 


void *thread 1(void *arg) (  // 第 一 个 线程 


int j; 
for (j = 0; j < 10000000; j++) { // 开 始 累加 
gentt; 


) 
pthread exit((void *)0); 


} 
void *thread 2(void *arg) ( . // 第 二 个 线程 
int j; 
for (j = 0; j < 10000000; j++) { // 开 始 累加 
gcnt*; 


) 
pthread exit((void *)0); 


int main(void) 


int j,err; 
pthread t thl, th2; 


for (j = 0; j < 10; j++) // 做 10 次 
t 


err-pthread create(&thl, NULL, thread 1, (void *)0);// 创 建 第 一 个 线程 


if (err t= 0) f 
printf("create new thread error:$sMn", strerror(err)); 
exit(0); 

) 


err = pthread create(&th2, NULL, thread 2, (void *)0);// 创 建 第 二 个 线程 


if (err != 0) ( 
printf("create new thread error:$s Mn", strerror(err)); 
exit(0); 


err = pthread join(thl, NULL); // 等 待 第 一 个 线程 结束 

if (err != 0) ( 
printf("wait thread done error:$sMn", strerror(err)); 
exit (1); 

} 

err = pthread join(th2, NULL); // 等 待 第 二 个 线程 结束 


if (err != 0) ( 
printf("wait thread done error:$s Mn", strerror(err)); 
exit (1); 

I: 


printf("gcn-$dMn", gcn); 
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gcn = 0; 
} 


return 0; 


) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost cpp98]4 ./test 
gcn-17945938 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-15315061 
gcn-20000000 
gcn-16248825 


从 结果 可 以 看 到 ， 有 几 次 没有 达到 20 000 000. 

上 面 的 例子 是 一 个 语句 被 打 断 的 情况 ， 有 时 候 还 会 有 一 个 事务 不 能 被 打 断 。 比 如 ， 一 个 事务 
需要 多 条 语句 完成 ， 并 且 不 可 打 断 ， 如 果 打 断 的 话 ， 其 他 需要 这 个 事务 结果 的 线程 则 可 能 会 得 到 非 
预料 的 结果 。 下 面 我 们 再 看 一 个 例子 ， 有 这 样 一 个 需求 ， 伙 计 在 卖 商品 时 ， 每 次 卖 出 50 元 的 货物 
就 要 收 50 元 的 钱 ， 老 板 每 隔 一 秒 钟 就 要 去 清点 店 里 的 货物 和 金钱 的 总 和 ， 看 总 和 有 没有 少 。 我 们 
可 以 创建 两 个 线程 ， 一 个 线程 代表 伙计 卖 货 收 钱 这 个 事务 ， 另 一 个 线程 模拟 老板 验证 总 和 的 操作 。 
抽象 地 讲 ， 就 是 一 个 线程 对 全 局 变量 进行 写 操作 ， 另 一 个 线程 对 全 局 变量 进行 读 操 作 。 


【 例 9.2】 不 用 线程 同步 的 卖 货 程序 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <stdio.h> 
#include <unistd.h> 
#include «pthread.h» 


int a = 200; // 代 表 有 价值 200 元 的 货物 
int b = 100; // 代 表现 在 有 100 元 现金 


void* ThreadA(void*) // 模 拟 伙计 卖 货 收 钱 
t 
while (1) 
t 
a -= 50; // 卖 出 价值 50 元 的 货物 
b += 50;// 收 回 50 元 钱 
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void* ThreadB(void*) // 模 拟 老板 对 账 
{ 
while (1) 
{ 
printf ("%d\n", a + b); // 打 印 当前 货物 和 现金 的 总 和 
sleep(1); // 隔 一 秒 


) 


int main() 
t 
pthread t tida, tidb; 


pthread create(&tida, NULL, ThreadA, NULL); // 创 建 伙计 卖 货 线 程 
pthread create(&tidb, NULL, ThreadB, NULL); // 创 建 老 板 对 账 线 程 
pthread join(tida, NULL); // 等 待 线程 结束 
pthread join(tidb, NULL); // 等 待 线程 结束 
return 1; 
) 
(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 
[root@localhost cpp98]# ./test 
300 
250 
250 
300 
250 
300 
250 
o 
[rootelocalhost cpp98]4 
按 CuléC 键 后 程序 停止 。 在 这 个 例子 中 ， 线 程 B 每 隔 一 秒 就 检查 一 下 当前 货物 和 现金 的 总 和 
是 否 是 300, 以 此 来 判断 伙计 是 否 私吞 钱 款 , 伙计 虽然 在 卖力 地 卖 货 和 收 钱 , 但 无 奈 还 是 出 现 了 250, 
真是 有 口 难 辩 啊 。 发 生 这 种 情况 的 原因 是 伙计 在 卖 出 货物 和 收 货款 之 间 被 老板 的 对 账 线 程 打 断 了 。 
下 面 我 们 用 互 斥 锁 来 帮 伙 计 证 明 清白 。 
在 讲述 互 斥 锁 之 前 ， 我 们 首先 要 了 解 一 下 临界 资源 和 临界 区 的 概念 。 所 谓 临 界 资源 ， 是 一 次 
仅 允 许 一 个 线程 使 用 的 共享 资源 。 对 于 临界 资源 ， 各 线程 应 该 互 斥 地 对 其 访问 。 每 个 线程 中 访问 临 
界 资 源 的 那 段 代 码 称 为 临界 区 〈Critical Section? ， 又 称 临界 段 。 因 为 临界 资源 要 求 每 个 线程 互 斥 
地 对 其 访问 ， 所 以 每 次 只 准许 一 个 线程 进入 临界 区 ,进入 后 其 他 进程 不 允许 再 进入 , 一 直 要 等 到 临 
界 区 中 的 线程 退出 。 我 们 可 以 用 线程 同步 机 制 来 互 斥 地 进入 临界 区 。 
一 般 来 讲 ， 线 程 进入 临界 区 需要 遵循 下 列 原则 : 


(1) 如 果 有 若干 线程 要 求 进入 空闲 的 临界 区 ， 一 次 仅 允 许 一 个 线程 进入 。 
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(2) 任何 时 候 ， 处 于 临界 区 内 的 线程 不 可 多 于 一 个 。 若 已 有 线程 进入 自己 的 临界 区 ， 则 其 他 
所 有 试图 进入 临界 区 的 进程 必须 等 待 。 

G) 进入 临界 区 的 线程 要 在 有 限时 间 内 退出 ， 以 便 其 他 线程 能 及 时 进入 自己 的 临界 区 。 

(4) 如 果 进 程 不 能 进入 自己 的 临界 区 ， 则 应 让 出 CPU (阻塞) ， 避 免 进程 出 现 “ 忙 等 ”现象 。 


9.3 利用 POSIX 多 线程 API 函数 进行 线程 同步 


POSIX 提供 了 3 种 方式 进行 线程 同步 ， 即 互 斥 锁 、 读 写 锁 和 条 件 变量 。 
9.3.0. HRH 


1. 互 斥 锁 的 概念 

互 斥 锁 〈 也 可 称 互 斥 量 ) 是 线程 同步 的 一 种 机 制 ， 用 来 保护 多 线程 的 共享 资源 。 同 一 时 刻 ， 
只 允许 一 个 线程 对 临界 区 进行 访问 。 互 斥 锁 的 工作 流程 是 : 初始 化 一 个 互 斥 锁 ， 在 进入 临界 区 前 把 
互 斥 锁 加 锁 〈 防 止 其 他 线程 进入 临界 区 ) ， 退 出 临界 区 的 时 候 把 互 斥 锁 解锁 (让 别 的 线程 有 机 会 进 
入 临界 区 ) ， 最 后 不 用 互 斥 锁 的 时 候 就 销毁 它 。POSIX 库 中 用 类 型 pthread_mutex_t 来 定义 一 个 互 
斥 锁 。pthread_mutex_t 是 一 个 联合 体 类 型 ， 定 义 在 pthreadtypes.h 中 ， 有 具体 如 下 : 


/* Data structures for mutex handling. The structure of the attribute 
type is not exposed on purpose. */ 
typedef union 
{ 
struct _ pthread mutex s 
t 
int lock; 
unsigned int _ count; 
int _ owner; 
#ifdef — x86 64 — 
unsigned int _ nusers; 
#endif 
/* KIND must stay at this position in the structure to maintain 
binary compatibility. */ 
int kind; 
#ifdef _ x86 64 — 
int spins; 
pthread list t list; 
# define ^ PTHREAD MUTEX HAVE PREV 1 
felse 
unsigned int _ nusers; 
. $extension union 
t 
int — spins; 
. pthread slist t list; 
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#endif 
} _ data; 
char _size[__SIZEOF_ PTHREAD MUTEX T]; 
long int align; 
} pthread mutex t; 
我 们 不 需要 去 深究 这 个 类 型 ， 只 要 了 解 即 可 。 注 意 使 用 的 时 候 不 需要 包含 pthreadtypes.h, H 
需要 包含 pthread.h 文件 即 可 ， 因 为 pthread.h 会 包含 pthreadtypes.h 文件 。 
我 们 可 以 如 下 定义 一 个 互 斥 变量 : 


pthread mutex t mutex; 


2. 互 斥 锁 的 初始 化 
用 于 初始 化 互 斥 锁 的 函数 是 pthread_mutex_init (这 种 初始 化 方式 叫 函数 初始 化 ) ， 声 明 如 下 : 


int pthread mutex init(pthread mutex t *restrict mutex,const 
pthread mutexattr t *restrict attr); 


其 中 , 参数 mutex 是 指向 pthread. mutex. t 变量 的 指针 ; attr 是 指向 pthread. mutexattr. t 的 指针 ， 
表示 互 斥 锁 的 属性 ， 如 果 赋 值 NULL， 则 使 用 默认 的 互 斥 锁 属性 ， 该 参数 通常 使 用 NULL。 如 果 函 
数 执行 成 功 就 返回 0， 否 则 返回 错误 码 。 

注意 : 关键 字 restrict 只 用 于 限定 指针 ， 用 于 告知 编译 器 所 有 修改 该 指针 所 指向 内 容 的 操作 全 
部 都 是 基于 该 指针 的 , 即 不 存在 其 他 进行 修改 操作 的 途径 , 这 样 的 后 果 是 帮助 编译 器 进行 更 好 的 代 
码 优化 ， 生 成 更 有 效率 的 汇编 代码 。 

使 用 函数 pthread_mutex_init 初始 化 互 斥 锁 属于 动态 方式 ， 还 可 以 用 宏 PTHREAD_MUTEX_ 
INITIALIZER 来 静态 地 初始 化 互 斥 锁 (这 种 方式 叫 常量 初始 化 )， 这 个 宏 定义 在 pthread.h 中 ， 定 
义 如 下 : 

# define PTHREAD MUTEX INITIALIZER \ 

EO N r OO 

它 用 一 些 初 始 化 值 来 初始 化 一 个 互 斥 锁 。 用 PTHREAD MUTEX INITIALIZER 来 初始 化 一 个 
互 斥 锁 可 以 这 样 写 : 

pthread mutex t mutex = PTHREAD MUTEX INITIALIZER; 

注意 ， 如 果 mutex 是 指针 ， 则 不 能 用 这 种 静态 方式 ， 例 如 : 

pthread mutex t * pmutex = (pthread mutex t 


*)malloc(sizeof(pthread mutex t)); 
pmutex = PTHREAD MUTEX INITIALIZER; // 这 样 是 错误 的 





因为 PTHREAD_MUTEX_INITIALIZER 相当 于 一 组 常量 , 只 能 对 pthread_mutex_t 的 变量 进行 
赋值 ， 而 不 能 赋值 给 一 个 指针 ， 即 使 这 个 指针 已 经 分 配 了 内 存 空 间 。 如 果 要 对 指针 进行 初始 化 ， 可 
以 用 函数 pthread_mutex_init， 比 如 : 


pthread mutex t *pmutex = (pthread mutex t 





多 线程 高 级 编程 第 9 党 





*)malloc (sizeof (pthread mutex t)); 


pthread mutex init(pmutex, NULL); // 这 个 写法 是 正确 的 ， 动 态 初始 化 一 个 互 斥 锁 
或 者 可 以 先 定义 变量 ， 再 调用 初始 化 函数 进行 初始 化 ， 例 如 : 


pthread mutex t mutex; 
pthread mutex init(&mutex, NULL); 


注意 ， 静 态 初始 化 的 互 斥 锁 是 不 需要 销毁 的 ， 而 动态 初始 化 的 互 斥 锁 是 需要 销毁 的 ， 销 毁 函 数 
会 在 后 面 讲 到 。 

3. 互 斥 锁 的 上 锁 和 解锁 

一 个 互 斥 锁 成 功 初 始 化 后 ， 就 可 以 用 于 上 锁 和 解锁 了 ， 上 锁 是 为 了 防止 其 他 线程 进入 临界 区 ， 


解锁 则 允许 其 他 线程 进入 临界 区 。 用 于 上 锁 的 函数 是 pthread_mutex_lock 或 pthread_mutex_trylock， 
前 者 声明 如 下 : 

int pthread mutex lock (pthread mutex t *mutex); 

其 中 ， 参 数 mutex 是 指向 pthread mutex t 变量 的 指针 ， 应 该 已 经 成 功 初始 化 过 。 函 数 执行 成 
功 时 返回 0， 和 否则 返回 错误 码 。 值 得 注意 的 是 ， 如 果 调 用 该 函数 时 互 斥 锁 已 经 被 其 他 线程 上 锁 了 ， 
则 调用 该 函数 的 线程 将 阻塞 。 

另 一 个 上 锁 函 数 pthread_mutex_trylock 在 调用 时 ， 如果 互 斥 锁 已 经 上 锁 了 ， 则 并 不 阻塞 , 而 是 
立即 返回 ， 并 且 函 数 返回 EBUSY， 函 数 声明 如 下 : 

int pthread mutex trylock(pthread mutex t *mutex); 

其 中 ， 参 数 mutex 是 指向 pthread_mutex_t 变量 的 指针 ， 应 该 已 经 成 功 初始 化 过 。 函 数 执行 成 
功 时 返回 0， 和 否则 返回 错误 码 。 

当 线 程 退出 临界 区 后 ， 要 对 互 斥 锁 进 行 解锁 。 解 锁 的 函数 是 pthread_mutex_unlock， 声明 如 下 : 

int pthread mutex unlock(pthread mutex t *mutex); 

其 中 ， 参 数 mutex 是 指向 pthread mutex. t 变量 的 指针 ， 应 该 是 已 上 锁 的 互 斥 锁 。 函 数 执行 成 
功 时 返回 0， 和 否则 返回 错误 码 。 需 要 注意 的 是 ，pthread_mutex_unlock 要 和 pthread_mutex_lock 成 对 
使 用 。 

4. 互 斥 锁 的 销毁 

当 互 斥 锁 用 完 后 ， 最 终 要 销毁 ， 用 于 销毁 互 斥 锁 的 函数 是 pthread_mutex_destroy， 声 明 如 下 : 


int pthread mutex destroy(pthread mutex t *mutex); 


其 中 ， 参 数 mutex 是 指向 pthread mutex t 变量 的 指针 ， 应 该 是 已 初始 化 的 互 斥 锁 。 函 数 执行 
成 功 时 返回 0， 否则 返回 错误 码 。 
关于 互 斥 锁 的 基本 函数 介绍 完了 ， 下 面 我 们 通过 例子 来 加 深 理解 。 
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【 例 9.3】 用 互 斥 锁 的 多 线程 累加 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include 
#include 
#include 
#include 
#include 
#include 


int gcn 


<stdio.h> 
<unistd.h> 
<Pthread .h> 
<sys/time.h> 
<string.h> 
<cstdlib> 


= 0; 


pthread mutex t mutex; 


void *thread 1 (void *arg) ( 
int j; 


for (j = 


) 


0; j < 10000000; j++) ( 
pthread mutex lock(&mutex); 
genet; 

pthread mutex unlock(&mutex); 


pthread exit((void *)0); 


void *thread 2(void *arg) ( 
int j; 


for (j = 0; 


) 


j < 10000000; j++) ( 
pthread mutex lock(&mutex); 
gcnt*; 


pthread mutex unlock(&mutex); 


pthread exit((void *)0); 


) 


int main(void) 


t 


int j,err; 


pthread t thl, 


pthread mutex init(&mutex, 


th2; 


NULL); 


for (G = OF j < 107 j++) 


t 


err = pthread create(&thl, NULL, thread 1, 


if (err != 0) ( 


// 解 锁 


// 初 始 化 互 斥 锁 


(void *)0); 


printf("create new thread error:$s Mn", strerror(err)); 


exit (0); 
} 


err = pthread create(&th2, NULL, thread 2, 


if (err != 0) { 


(void *)0); 
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printf("create new thread error:%s\n", strerror(err)); 
exit (0); 


err = pthread join(thl, NULL); 
if (err !- 0) ( 
printf("wait thread done error:$sMXn", strerror(err)); 
exit (1); 
) 
err - pthread join(th2, NULL); 
if (err != 0) ( 
printf("wait thread done error:$sWMn", strerror(err)); 
exit (1); 
) 
printf("gcn-$dWn", gcn); 
gcn = 0; 
) 
pthread mutex destroy(&mutex); // 销 毁 互 斥 锁 


return 0; 


) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost cpp98]# ./test 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 
gcn-20000000 


正如 所 料 , 加 了 互 斥 锁 来 同步 线程 后 , 每 次 都 能 得 到 正确 的 结果 。 下 面 我 们 来 帮 伙 计 证 明 一 下 。 
【 例 9.4】 用 互 斥 锁 进行 同步 的 卖 货 程序 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <stdio.h> 
#include <unistd.h> 
#include «pthread.h» 


int a = 200; // 当 前 货物 价值 
int b = 100; // 当 前 现金 
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pthread mutex t lock; // 定 义 一 个 全 局 的 互 斥 锁 


void* ThreadA(void*) // 伙 计 卖 货 线程 
t 


while (1) 

t 
pthread mutex lock(&lock); // 上 锁 
a -= 50; // 卖 出 价值 50 元 的 货物 
b += 50;// 收 回 50 元 钱 
pthread mutex unlock(&lock); // 解 锁 


} 


void* ThreadB(void*) // 老 板 对 账 线程 
{ 
while (1) 
{ 
pthread mutex lock(&lock); // 上 锁 
printf("$dWMn", a + b); 
pthread mutex unlock(&lock); // 解 锁 
sleep(1); 


) 


int main() 

ü 
pthread t tida, tidb; 
pthread mutex init(&lock, NULL); // 初 始 化 互 斥 锁 
pthread create(&tida, NULL, ThreadA, NULL); // 创 建 伙计 卖 货 线 程 
pthread create(&tidb, NULL, ThreadB, NULL); // 创 建 老 板 对 账 线 程 
pthread join(tida, NULL); 
pthread join(tidb, NULL); 


pthread mutex destroy(&lock); // 销 毁 互 斥 锁 


return 1; 


) 


(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost cpp98]# g++ -o test test.cpp -lpthread 
[root8localhost cpp98]# ./test 

300 

300 

300 

300 
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300 

300 

[root@localhost cpp98]4 

这 个 例子 加 了 互 斥 锁 同 步 ， 从 中 可 以 发 现 ， 老 板 每 次 对 账 输出 的 结果 都 是 300。 这 是 因为 伙计 
卖 货 和 收 钱 的 过 程 没 有 被 打 断 ， 账 面 就 对 了 。 


9.32 ES 


1. 读 写 锁 的 概念 

前 面 我 们 讲述 了 通过 互 斥 锁 来 同步 线程 访问 临界 资源 的 方法 。 回 想 一 下 前 面 介 绍 的 互 斥 锁 ， 
它 只 有 两 个 状态 ， 要 么 是 加 锁 状 态 ， 要 么 是 不 加 锁 状 态 。 假 如 现在 一 个 线程 a 只 是 想 读 一 个 共享 
变量 i ， 因 为 不 确定 是 否 会 有 线程 去 写 它 ， 所 以 我 们 还 是 要 对 它 进 行 加 锁 。 但 是 这 时 又 有 一 个 线 
程 b 试图 读 共 享 变量 i， 发 现 被 锁 住 ， 那 么 b 不 得 不 等 到 a 释放 了 锁 后 才能 获得 锁 并 读 取 i 的 值 ， 
但 是 两 个 读 取 操作 即使 是 同时 发 生 的 ,也 并 不 会 像 写 操作 那样 造成 竞争 ,因为 它们 不 修改 变量 的 值 。 
所 以 我 们 期 望 在 多 个 线程 试图 读 取 共 享 变量 的 值 时, 它们 可 以 立刻 获取 因为 读 而 加 的 锁 , 而 不 需要 
等 待 前 一 个 线程 释放 。 读 写 锁 解决 了 上 面 的 问题 。 它 提供 了 比 互 斥 锁 更 好 的 并 行 性 。 因 为 以 读 模式 
加 锁 后 ， 当 有 多 个 线程 试图 再 以 读 模式 加 锁 时 ， 并 不 会 造成 这 些 线程 阻塞 在 等 待 锁 的 释放 上 。 

读 写 锁 是 多 线程 同步 的 另 一 种 机 制 。 在 一 些 程序 中 存在 读 操作 和 写 操作 问题 ， 也 就 是 说 ， 对 
某 些 资源 的 访问 会 存在 两 种 可 能 的 情况 ， 一 种 情况 是 访问 必须 是 排他 的 , 就 是 独占 的 意思 ,这 种 操 
作 称 作 写 操作 ， 另 一 种 情况 是 访问 方式 是 可 以 共享 的 ， 就 是 可 以 有 多 个 线程 同时 去 访问 某 个 资源 ， 
这 种 操作 就 称 作 读 操作 。 这 个 问题 模型 是 从 对 文件 的 读 写 操作 中 引申 出 来 的 。 把 对 资源 的 访问 细 分 
为 读 和 写 两 种 操作 模式 ， 这 样 可 以 大 大 增加 并 发 效率 。 读 写 锁 比 互 斥 锁 的 适用 性 更 高 ， 并 行 性 也 更 
高 。 需要 注意 的 是 , 这 里 只 是 说 并 行 效率 比 互 斥 锁 高 , 并 不 是 速度 一 定 比 互 斥 锁 快 , 读 写 锁 更 复杂 ， 
系统 开销 更 大 。 并 发 性 好 对 于 用 户 体验 非常 重要 , 假设 使 用 互 斥 锁 需 要 0.5 秒 , 使 用 读 写 锁 需要 0.8 
秒 ， 在 类 似 学 生 管 理 系统 的 软件 中 ， 可 能 90% 的 操作 都 是 查询 操作 。 如 果 突 然 有 20 个 查询 请 求 ， 
使 用 的 是 互 斥 锁 ， 则 最 后 的 查询 请 求 被 满足 需要 10 秒 ， 估 计 没 人 能 受 得 了 。 使 用 读 写 锁 时 ， 因 为 
读 锁 能 够 多 次 获得 ， 所 以 20 个 请 求 中 ， 每 个 请 求 都 能 在 1 秒 左右 被 满足 ， 用 户 体验 好 得 多 。 

读 写 锁 有 几 个 重要 特点 需要 记 住 ; 


CD 如 果 一 个 线程 用 读 锁 锁定 了 临界 区 ， 那 么 其 他 线程 也 可 以 用 读 锁 来 进入 临界 区 ， 这 样 就 
可 以 有 多 个 线程 并 行 操作 。 这 个 时 候 如 果 再 用 写 锁 加 锁 就 会 发 生 阻塞 ， 写 锁 请 求 阻塞 后 ， 后 面 继续 
有 读 锁 来 请 求 时 ， 这 些 后 来 的 读 锁 都 将 会 被 阻塞 。 这 样 避免 了 读 锁 长 期 占用 资源 ， 防 止 写 锁 饥饿 。 

(0 如 果 一 个 线程 用 写 锁 锁 住 了 临界 区 ， 那 么 其 他 线程 无 论 是 读 锁 还 是 写 锁 都 会 发 生 阻 塞 。 

POSIX 库 中 用 类 型 pthread_rwlock t 来 定义 一 个 互 斥 锁 ，pthread_rwlock t 是 一 个 联合 体 类 型 ， 
定义 在 pthreadtypes.h 中 ， 定 义 如 下 : 

typedef union 


t 
# ifdef — x86 64 _ 
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struct 
t 
int — lock; 
unsigned int nr readers; 
unsigned int _ readers wakeup; 
unsigned int writer wakeup; 
unsigned int _ nr readers queued; 
unsigned int nr writers queued; 
int — writer; 
int — shared; 
unsigned long int _ padl; 
unsigned long int _ pad2; 
/* FLAGS must stay at this position in the structure to maintain 
binary compatibility. */ 
unsigned int — flags; 
* define PTHREAD RWLOCK INT FLAGS SHARED 1 
) data; 
# else 
struct 
t 
int lock; 
unsigned int nr readers; 
unsigned int — readers wakeup; 
unsigned int _ writer wakeup; 
unsigned int . nr readers queued; 
unsigned int . nr writers queued; 
/* FLAGS must stay at this position in the structure to maintain 
binary compatibility. */ 
unsigned char — flags; 
unsigned char shared; 
unsigned char  padl; 
unsigned char — pad2; 
int — writer; 
) data; 
# endif 
char size[ SIZEOF PTHREAD RWLOCK T]; 
long int — align; 
) pthread rwlock t; 


我 们 不 需要 去 深究 这 个 类 型 ， 只 要 了 解 即 可 。 注意 使 用 的 时 候 不 需要 包含 pthreadtypes.h 文件 ， 
只 需要 包含 pthread.h 文件 即 可 ， 因 为 pthread.h 文件 会 包含 pthreadtypes.h 文件 。 
我 们 可 以 这 样 定义 一 个 读 写 锁 : 


pthread rwlock t rwlock; 


2. 读 写 锁 的 初始 化 


读 写 锁 有 两 种 初始 化 方式 ， 即 常量 初始 化 和 函数 初始 化 。 常 量 初始 化 通过 宏 
PTHREAD RWLOCK INITIALIZER 来 给 一 个 读 写 锁 变量 赋值 ， 比 如 : 
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pthread rwlock t rwlock = PTHREAD RWLOCK INITIALIZER; 


同 互 斥 锁 一 样 ， 这 种 方式 属于 静态 初始 化 方式 ， 不 能 对 一 个 读 写 锁 指 针 进 行 初始 化 ， 比 如 下 
面 这 样 是 错误 的 : 
pthread rwlock t *prwlock = (pthread rwlock t 


*)malloc(sizeof(pthread rwlock t)); 
prwlock = PTHREAD RWLOCK INITIALIZER; // 这 样 是 错误 的 


函数 初始 化 方式 属于 动态 初始 化 方式 ， 通 过 函数 pthread_rwlock_init 进行 。 该 函数 声明 如 下 : 


int pthread rwlock init(pthread rwlock t *restrict rwlock,const 
pthread rwlockattr t *restrict attr); 

其 中 ， 参 数 rwlock 是 指向 pthread rwlock t 类 型 变量 的 指针 ， 表 示 一 个 读 写 锁 ，attr 是 指向 
pthread_rwlockattr t 类 型 变量 的 指针 ， 表 示 读 写 锁 的 属性 ， 如 果 该 参数 为 NULL， 则 使 用 默认 的 读 
写 锁 属性 。 如 果 函 数 执行 成 功 就 返回 0， 否则 返回 错误 码 。 

静态 初始 化 的 读 写 锁 是 不 需要 销毁 的 ， 而 动态 初始 化 的 读 写 锁 是 需要 销毁 的 ， 销 毁 函 数 我 们 
会 在 后 面 讲 到 。 

比如 对 如 下 条 件 变 量 进行 初始 化 : 

pthread rwlock t *prwlock = (pthread rwlock t 


*)malloc(sizeof(pthread rwlock t)); 
pthread rwlock init (prwlock, NULL); 


或 者 


pthread rwlock t rwlock; 
pthread rwlock init (&rwlock, NULL); 


3. 读 写 锁 的 上 锁 和 解锁 

读 写 锁 的 上 锁 可 分 为 读 模式 下 的 上 锁 和 写 模 式 下 的 上 锁 。 读 模式 下 的 上 锁 函 数 有 
pthread rwlock rdlock 和 pthread rwlock tryrdlock。 前 者 声明 如 下 : 

int pthread rwlock rdlock(pthread rwlock t *rwlock); 

其 中 ， 参 数 rwlock 是 指向 pthread. rwlock t 变量 的 指针 ， 应 该 已 经 成 功 初 始 化 过 。 函 数 执行 成 
功 时 返回 0， 否则 返回 错误 码 。 值 得 注意 的 是 ， 如 果 调 用 该 函数 时 ， 读 写 锁 已 经 被 其 他 线程 在 写 模 
式 下 上 了 锁 或 者 有 一 个 线程 中 在 写 模式 下 等 待 该 锁 , 则 调用 该 函数 的 线程 将 阻塞 ; 如 果 其 他 线程 在 
读 模 式 下 已 经 上 锁 ， 则 可 以 获得 该 锁 ， 进 入 临界 区 。 

另 一 个 读 模 式 下 的 上 锁 函 数 pthread rwlock tryrdlock 在 调用 时 ， 如 果 读 写 锁 已 经 上 锁 了 ， 则 
并 不 阻塞 ， 而 是 立即 返回 ， 并 且 函 数 返 回 EBUSY， 函 数 声 明 如 下 : 


int pthread rwlock tryrdlock(pthread rwlock t *rwlock); 


其 中 ， 参 数 rwlock 是 指向 pthread rwlock t 变量 的 指针 ， 应 该 已 经 成 功 初始 化 过 。 函 数 执行 成 
功 时 返回 0， 否则 返回 错误 码 。 
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相对 于 读 模 式 下 的 上 锁 ， 写 模式 下 的 读 写 锁 也 有 两 个 上 锁 函 数 : pthread rwlock wrlock 和 
pthread rwlock trywrlock。 前 者 声明 如 下 : 

int pthread rwlock wrlock(pthread rwlock t *rwlock); 

其 中 ， 参数 rwlock 是 指向 pthread rwlock t 变 量 的 指针 ， 应 该 已 经 成 功 初始 化 过 。 函 数 执行 成 
功 时 返回 0, 否则 返回 错误 码 。 值得 注意 的 是 , 如 果 调 用 该 函数 时 , 读 写 锁 已 经 被 其 他 线程 上 锁 (无 
论 是 读 模式 还 是 写 模 式 ) ， 则 调用 该 函数 的 线程 将 阻塞 。 

函数 pthread_rwlock_trywrlock 和 pthread_rwlock_wrlock 类 似 ， 唯 一 的 区 别 是 读 写 锁 不 可 用 时 
不 会 阻塞 ， 而 是 返回 一 个 错误 值 EBUSY， 该 函数 声明 如 下 : 

int pthread rwlock trywrlock(pthread rwlock t *rwlock); 

其 中 ， 参 数 rwlock 是 指向 pthread rwlock t 变量 的 指针 ， 应 该 已 经 成 功 初始 化 过 。 函 数 执行 成 
功 时 返回 0， 和 否则 返回 错误 码 。 

除了 上 述 上 锁 函 数 外 ， 还 有 两 个 不 常用 的 上 锁 函 数 ， 它 们 可 以 设 定 在 规定 的 时 间 内 等 待 读 写 
锁 ， 如 果 等 不 到 ， 就 返回 ETIMEDOUT， 这 两 个 函数 声明 如 下 : 

int pthread rwlock timedrdlock(pthread rwlock t *restrict rwlock, const 
struct timespec *restrict abs timeout); 


int pthread rwlock timedwrlock(pthread rwlock t *restrict rwlock, const 
struct timespec *restrict abs timeout); 


这 两 个 函数 不 常用 ， 所 以 这 里 不 详细 说 明了 。 

当 线 程 退出 临界 区 后 , 要 对 读 写 锁 进行 解锁 , 解锁 的 函数 是 pthread_rwlock_unlock, 声明 如 下 : 

int pthread rwlock unlock(pthread rwlock t *rwlock); 

其 中 ,参数 rwlock 是 指向 pthread_rwlock_t 变量 的 指针 ， 应 该 是 已 上 锁 的 读 写 锁 。 函 数 执行 成 
功 时 返回 0， 否 则 返回 错误 码 。 需 要 注意 的 是 ， 该 函数 要 与 上 锁 函 数 成 对 使 用 。 

4. 读 写 锁 的 销毁 

当 读 写 锁 用 完 后 ， 最 终 要 销毁 ， 用 于 销毁 读 写 锁 的 函数 是 pthread_rwlock_destroy， 声 明 如 下 : 

int pthread rwlock destroy(pthread rwlock t *rwlock); 


其 中 ， 参 数 rwlock 是 指向 pthread. mutex. t 变量 的 指针 ， 它 应 该 是 已 初始 化 的 互 斥 锁 。 函 数 执 
行 成 功 时 返回 0， 和 否则 返回 错误 码 。 

关于 读 写 锁 的 基本 函数 介绍 完了 ， 下 面 我 们 通过 例子 来 加 深 理 解 。 
【 例 9.5】 互 斥 锁 和 读 写 锁 速 度 大 PK 

(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 

#include <stdio.h> 

#include <unistd.h> 


#include «pthread.h» 
#include <sys/time .h> 
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#include <string.h> 
#include <cstdlib> 


int gcn = 0; 


pthread mutex t mutex; 
pthread rwlock t rwlock; 


void *thread l(void *arg) ( 

int j; 

volatile int a; 

for (j = 0; j < 10000000; j++) ( 
pthread mutex lock(&mutex); // 上 锁 
a = gon; // 只 读 全 局 变量 gcn 
pthread mutex unlock(&mutex); // 解 锁 

) 

pthread exit((void *)0); 


void *thread 2(void *arg) ( 

int j; 

volatile int b; 

for (j = 0; j < 10000000; j++) ( 
pthread mutex lock(&mutex); // 上 锁 
b = gen; // 只 读 全 局 变量 gcn 
pthread mutex unlock(&mutex); // 解 锁 

) 

pthread exit((void *)0); 


void *thread 3(void *arg) ( 

int j; 

volatile int a; 

for (j = 0; j < 10000000; j++) { 
pthread rwlock rdlock(&rwlock); // 上 锁 
a = gen; // 只 读 全 局 变量 gcn 
pthread rwlock unlock(&rwlock); 

} 

pthread exit((void *)0); 


void *thread 4(void *arg) ( 
ant j; 
volatile int b; 
for (j = 0; j < 10000000; j++) { 
pthread rwlock rdlock(&rwlock); // 上 锁 
b = gcn; // 只 读 全 局 变量 gcn 
pthread rwlock unlock(&rwlock); // 解 锁 
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pthread exit((void *)0); 


int mutextVer (void) 
t 
int j,err; 
pthread t thl, th2; 


struct timeval start; 
clock t tl, t2; 
struct timeval end; 


pthread mutex init(&mutex, NULL); // 初 始 化 互 斥 锁 
gettimeofday(&start, NULL); 


err - pthread create(&thl, NULL, thread 1, (void *)0); 

if (err != 0) ( 
printf("create new thread error:$sWMn", strerror(err)); 
exit (0); 

) 

err - pthread create(&th2, NULL, thread 2, (void *)0); 

if (err !- 0) ( 
printf("create new thread error:$sMn", strerror(err)); 
exit(0); 


err = pthread join(thl, NULL); 

if (err t= 0) ( 
printf("wait thread done error:$sWMn", strerror(err)); 
exit(1); 

} 

err = pthread join(th2, NULL); 

if (err != 0) { 
printf("wait thread done error:$sMn", strerror(err)); 
exit (1); 


gettimeofday (&end, NULL); 


pthread mutex destroy(&mutex); // 销 毁 互 斥 锁 


long long total time = (end.tv_sec - start.tv sec) * 1000000 + (end.tv usec 
- start.tv usec); 


total time /- 1000; // get the run time by millisecond 
printf("total mutex time is $11d ms\n", total time); 
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return 0; 


int rdlockVer (void) 


int j, err; 
pthread t thl, th2; 


struct timeval start; 
clock t ti, t27 
struct timeval end; 


pthread rwlock init(&rwlock, NULL); // 初 始 化 读 写 锁 
gettimeofday(&start, NULL); 


err - pthread create(&thl, NULL, thread 3, (void *)0); 

if (err != 0) ( 
printf("create new thread error:$sWMn", strerror(err)); 
exit (0); 

) 

err - pthread create(&th2, NULL, thread 4, (void *)0); 

if (err !- 0) ( 
printf("create new thread error:$s Mn", strerror(err)); 
exit(0); 


err = pthread join(thl, NULL); 

if (err != 0) ( 
printf("wait thread done error:$sWMn", strerror(err)); 
exit(1); 

) 

err - pthread join(th2, NULL); 

if (err !2 0) ( 
printf("wait thread done error:$sWMn", strerror(err)); 
exit (1); 


gettimeofday (&end, NULL); 
pthread rwlock destroy(&rwlock); // 销 毁 互 斥 锁 
long long total time = (end.tv sec - start.tv sec) * 1000000 + (end.tv usec 


- start.tv usec); 
total time /- 1000; // get the run time by millisecond 
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printf("total rwlock time is $11d ms\n", total time); 


return 0; 
} 


int main() 

t 
mutextVer(); 
rdlockVer(); 


return 0; 
) 
(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test tes.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 
[root@localhost cpp98]# g++ -o test test.cpp -lpthread 
[rootélocalhost cpp98]# ./test 


total mutex time is 439 ms 
total rwlock time is 836 ms 


从 这 个 例子 中 可 以 看 出 ， 即 使 都 是 在 读 情 况 下 ， 读 写 锁 依 然 比 互 斥 锁 速度 慢 。 那 是 不 是 说 读 写 
锁 没 什么 作用 了 呢 ? 不 是 这 样 的 ， 虽 然 速度 上 可 能 不 如 互 斥 锁 , 但 并 发 性 好 ,并 发 性 对 于 用 户 体验 
非常 重要 。 对 于 并 发 性 要 求 高 的 地 方 ， 应 该 优先 考虑 读 写 锁 。 


9.3.3 条 件 变 量 


1. 条 件 变量 的 概念 

线程 间 的 同步 有 这 样 一 种 情况 : 线程 A 需要 等 某 个 条 件 成 立 才能 继续 往 下 执行 ， 现 在 这 个 条 
件 不 成 立 ， 线 程 A 就 阻塞 等 待 ， 而 线程 B 在 执行 过 程 中 使 这 个 条 件 成 立 了 ， 于 是 唤醒 线程 A 继续 
执行 。 在 POSIX 线程 库 中 ， 同 步 机 制 之 一 的 条 件 变量 (Condition Variable) 就 是 用 在 这 种 场合 ， 
它 可 以 让 一 个 线程 等 待 “ 条 件 变量 的 条 件 ” 而 挂 起 ， 另 一 个 线程 在 条 件 成 立 后 向 挂 起 的 线程 发 送 条 
件 成 立 的 信号 。 这 两 种 行为 都 是 通过 条 件 变量 相关 的 函数 实现 的 。 

为 了 防止 线程 间 竞争 ， 使 用 条 件 变量 时 ， 需 要 联合 互 斥 锁 一 起 使 用 。 条 件 变 量 常用 在 多 线程 
之 间 关 于 共享 数据 状态 变化 的 通信 中 , 当 一 个 线程 的 行为 依赖 于 另 一 个 线程 对 共享 数据 状态 的 改变 
时 ， 就 可 以 使 用 条 件 变 量 来 同步 它们 。 

我 们 首先 来 看 一 个 经 典 问 题 一 一 生产 者 -消费 者 问题 。 生 产 者 -消费 者 (producer-consumer) 问 
题 也 称 作 有 界 缓冲 区 Cbounded-buffer) 问题 ， 两 个 线程 共享 一 个 公共 的 固定 大 小 的 缓冲 区 。 其 中 
一 个 是 生产 者 ， 用 于 将 数据 放 入 缓冲 区 ， 如 此 反复 ; 另 一 个 是 消费 者 ， 用 于 从 缓冲 区 中 取出 数据 ， 
如 此 反复 。 问 题 出 现在 当 缓冲 区 已 经 满 了 ， 而 此 时 生产 者 还 想 向 其 中 放 入 一 个 新 的 数据 项 的 情形 ， 
其 解决 方法 是 让 生产 者 进行 休眠 , 等待 消费 者 从 缓冲 区 中 取出 一 个 或 者 多 个 数据 后 再 去 唤醒 它 。 同 
样 地 ， 当 缓冲 区 已 经 空 了 ， 而 消费 者 还 想 去 取 数 据 时 ， 也 可 以 让 消费 者 进行 休眠 ， 等 待 生产 者 放 入 
一 个 或 者 多 个 数据 时 再 唤醒 它 。 看 似 蛮 对 的 , 但 其 实在 实现 时 会 有 一 个 死 锁 情况 存在 。 为 了 跟踪 绥 
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冲 区 中 的 消息 数目 ， 需 要 一 个 全 局 变量 count。 如 果 缓冲 区 最 多 存放 N 个 数据 ， 则 生产 者 的 代码 会 
首先 检查 count 是 否 达到 N， 如 果 是 ， 则 生产 者 休眠 ， 否 则 生产 者 向 缓冲 区 中 放 入 一 个 数据 ， 并 增 
加 count 的 值 。 消 费 者 的 代码 也 与 此 类 似 ， 首 先 检测 count 是 否 为 0， 如 果 是 ， 则 休眠 ， 和 否则 从 组 
冲 区 中 取出 消息 并 递减 count 的 值 。 同 时 ， 每 个 线程 也 需要 检查 是 否 需要 唤醒 另 一 个 进程 。 代 码 
如 下 : 


pthread mutex t mutex; // 定 义 一 个 互 斥 锁 ， 用 于 让 生产 线程 和 消费 线程 对 缓冲 区 的 互 斥 访问 
#define N 100 // 缓冲 区 大 小 








int count = 0; // 跟踪 缓冲 区 的 记录 数 
/* 生产 者 线程 */ 
void Procedure (void) 
{ 
int item; // 缓冲 区 中 的 数据 项 
while (true) // 无 限 循 环 
{ 
item = produce item() 7 // 产生 下 一 个 数据 项 
if (count == N) // 如 果 缓 冲 区 满 了 ， 进 行 休眠 
{ 
sleep(); 
} 
pthread mutex lock(&mutex); // 上 锁 
insert item(item); // 将 新 数据 项 放 入 缓冲 区 
count = count + 1; // 计数 器 加 1 


pthread mutex unlock(&mutex);  // 解 锁 


if (count == 1) // 表明 插入 之 前 为 空 
{ // 消费 者 等 待 
wakeup (consumer) ; // 唤醒 消费 者 
H 
H 
H 
/* 消费 者 线程 */ 
void consumer (void) 
{ 
int item; // 缓冲 区 中 的 数据 项 
while (true) // 无 限 循环 


t 
if (count == 0)  // 如 果 缓 冲 区 为 空 ， 进 入 休眠 
t 
sleep(); 
} 
pthread mutex lock(&mutex); // 上 锁 
item = remove item(); // 从 缓冲 区 中 取出 一 个 数据 项 
count = count - 1; // 计数 器 减 1 
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pthread mutex unlock(&mutex); // 解 锁 

if (count == N -1) // 缓冲 区 有 空 槽 

li // 唤醒 生产 者 
wakeup (producer); 


Hh 


) 


当 缓 冲 区 为 空 时 ， 消 费 线 程 刚刚 读 取 count 的 值 为 0， 准备 开始 休眠 Csleep) 了 ， 而 此 时 调度 
程序 决定 暂停 消费 线程 并 启动 执行 生产 线程 。 生 产 者 向 缓冲 区 中 加 入 一 个 数据 项 ，count 的 值 加 1 。 
现在 count 的 值 变 成 了 1。 推断 刚才 count 为 0， 所 以 此 时 消费 者 一 定 在 休眠 ， 于 是 生产 者 开始 调用 
wakeup (consumer) 来 唤醒 消费 者 。 但 是 ， 此 时 消费 者 实际 上 并 没有 休眠 ， 所 以 wakeup 信号 就 丢 
失 了 。 当 消费 者 下 次 运行 时 ， 它 将 进入 休眠 〈 因 为 它 已 经 判断 过 count 是 0 了 ) 。 而 生产 者 下 次 运 
行 的 时 候 ，count 会 继续 递增 ， 并 且 不 会 唤醒 consumer 了 (生产 者 认为 消费 者 醒 着 ) ， 所 以 迟早 
会 填 满 缓冲 区 ， 然 后 生产 者 也 休眠 , 这 样 两 个 线程 就 都 永远 地 休眠 下 去 了 。 产生 这 个 问题 的 关键 是 
消费 者 解锁 到 休眠 这 段 代 码 有 可 能 被 打 断 , 而 条 件 变量 的 重要 功能 是 把 释放 互 斥 锁 到 休眠 当 作 一 个 
原子 操作 ， 不 容 打 断 。 

POSIX 库 中 用 类 型 pthread cond t 来 定义 一 个 条 件 变量 ， 比 如 定义 一 个 条 件 变 量 : 


#include «pthread.h» 
pthread cond t cond; 


2. 条 件 变量 的 初始 化 

条 件 变 量 有 两 种 初始 化 方式 ， 即 常量 初始 化 和 函数 初始 化 。 常 量 初始 化 通过 宏 PTHREAD 
RWLOCK INITIALIZER 来 给 一 个 读 写 锁 变量 赋值 ， 比 如 : 

pthread cond t cond = PTHREAD COND INITIALIER; 


这 种 方式 属于 静态 初始 化 方式 ， 不 能 对 一 个 读 写 锁 指 针 进 行 初始 化 ， 比 如 下 面 的 代码 是 错误 的 : 


pthread cond t *pcond = (pthread cond t *)malloc(sizeof(pthread cond t)); 
pcond = PTHREAD COND INITIALIER; // 这 样 是 错误 的 


函数 初始 化 方式 属于 动态 初始 化 方式 ， 通 过 函数 pthread cond init 进行 ， 该 函数 声明 如 下 : 
int pthread cond init(pthread cond t *cond,pthread condattr t *cond attr); 


其 中 , 参数 cond 是 指向 pthread cond t 变量 的 指针 ; attr 是 指向 pthread. condattr t 变量 的 指针 ， 
表示 条 件 变量 的 属性 ， 如 果 赋 值 NULL， 则 使 用 默认 的 条 件 变量 属性 ， 该 参数 通常 使 用 NULL。 如 
果 函 数 执行 成 功 就 返回 0， 否则 返回 错误 码 。 

静态 初始 化 的 条 件 变量 是 不 需要 销毁 的 ， 而 动态 初始 化 的 条 件 变量 是 需要 销毁 的 ， 销 毁 函 数 
我 们 会 在 后 面 讲 到 。 

比如 对 如 下 条 件 变量 进行 初始 化 : 


pthread cond t *pcond = (pthread cond t *)malloc(sizeof(pthread cond 七 ) ) 
pthread cond init (pcond, NULL); 
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或 者 


pthread cond t cond; 
pthread cond init (&cond, NULL) ; 


下 面 的 代码 也 演示 了 一 个 条 件 变量 的 静态 初始 化 过 程 : 


#include «pthread.h» 
#include "errors.h" 


typedef struct my struct tag { 
pthread mutex t mutex; /* 对 变量 访问 进行 保护 */ 
pthread cond t cond;  /* 变量 值 发 生 改变 会 发 出 信号 */ 
int value; /* 被 互 斥 锁 保护 的 变量 */ 

) my struct t; 


my struct t data - ( 
PTHREAD MUTEX INITIALIZER, PTHREAD COND INITIALIZER, 0]; 


int main (int argc, char *argv[]) 
t 
return 0; 

) 

上 面 代码 初始 化 的 效果 和 用 函数 pthread. mutex. init 5j pthread. cond init (都 使 用 默认 属性 ) 进 
行 初始 化 的 效果 是 一 样 的 。 

3. 等 待 条 件 变 量 

pthread cond wait 和 pthread cond timedwait 用 于 等 待 条 件 变量 ， 并 且 将 线程 阻塞 在 一 个 条 件 
变量 上 。pthread_cond_wait 声明 如 下 : 

int pthread cond wait (pthread cond t *restrict cond,pthread mutex t *restrict 
mutex); 

其 中 , 参数 cond 指向 pthread. cond t 类 型 变量 的 指针 , 表示 一 个 已 经 初始 化 的 条 件 变量 ; mutex 
指向 一 个 互 斥 锁 变量 的 指针 ， 用 于 同步 线程 对 共享 资源 的 访问 。 如 果 函 数 执行 成 功 就 返回 0， 出 错 
返回 错误 编号 。 

前 面 提 到 过 ， 这 里 再 次 强调 ， 为 了 防止 多 个 线程 同时 请 求 函 数 pthread_cond_wait 形成 竞争 ， 
因此 条 件 变 量 必须 和 一 个 互 斥 锁 联合 使 用 。 如 果 条 件 不 满足 ， 调 用 pthread_cond_wait 会 发 生 这 些 
原子 操作 : 线程 将 mutex 解锁 、 线 程 被 条 件 变量 cond 阻塞 。 这 是 一 个 原子 操作 ， 不 会 被 打 断 。 被 
阻塞 的 线程 可 以 在 以 后 某 个 时 间 通 过 其 他 线程 执行 函数 pthread cond signal 或 
pthread cond broadcast 来 唤醒 。 线 程 被 唤醒 后 ， 如 果 条 件 还 不 满足 ， 该 线程 将 继续 阻塞 在 这 里 ， 等 
待 下 一 次 被 唤醒 。 这 个 过 程 可 以 用 while 循环 语句 来 实现 ， 比 如 : 








Lock (mutex) 


while (condition is false) { 
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Cond wait(cond, mutex, timeout) 
} 


DoSomething() 


Unlock (mutex) 


使 用 while 还 有 一 个 原因 是 , 等 待 在 条 件 变量 上 的 线程 被 唤醒 有 可 能 不 是 由 于 条 件 满足 而 是 由 
于 虚假 唤醒 (Spurious Wakeups) 。 虚 假 唤醒 在 POSIX 标准 里 是 默认 允许 的 ，wait 返回 只 是 代表 共 
享 数据 有 可 能 被 改变 ， 因 此 必须 要 重新 判断 。 

那么 什么 时 候 会 出 现 虚假 唤醒 呢 ? 

在 多 核 处 理 器 下 , pthread cond signal 可 能 会 激活 多 于 一 个 线程 (阻塞 在 条 件 变 量 上 的 线程 ) 。 

结果 是 ， 当 一 个 线程 调用 pthread_cond signal() 后 ， 多 个 调用 pthread_cond_wait() 或 
pthread cond timedwaitO) 的 线程 返回 。 

当 函 数 等 到 条 件 变量 时 ， 将 对 mutex 上 锁 并 唤醒 本 线程 。 这 也 是 一 个 原子 操作 。 由 于 
pthread cond wait 需要 释放 锁 ， 因 此 当 调 用 pthread_cond_wait 的 时 候 ， 互 斥 锁 必 须 已 经 被 调用 线 
程 锁定 。 由 于 收 到 信号 时 要 对 mutex 上 锁 【， 因 此 等 到 信号 时 ， 除 了 信号 来 到 外 ， 互 斥 锁 也 应 该 已 经 
解锁 了 ， 只 有 两 个 条 件 都 满足 ， 该 函数 才 会 返回 。 

函数 pthread_cond_timedwait 是 计时 等 待 条 件 变 量 ， 声 明 如 下 : 








int pthread cond timedwait(pthread cond t *restrict cond,pthread mutex t 
*restrict mutex,const struct timespec *restrict abstime); 

其 中 , 参数 cond 指向 pthread. cond. t 类 型 变量 的 指针 , 表示 一 个 已 经 初始 化 的 条 件 变量 ; mutex 
指向 一 个 互 斥 锁 变量 的 指针 ， 用 于 同步 线程 对 共享 资源 的 访问 ， 参 数 abstime 指向 结构 体 timespec 
变量 ， 表 示 等 待 的 时 间 ， 如 果 等 于 或 超过 这 个 时 间 ， 则 返回 ETIME。 结 构 体 timespec 定义 如 下 : 





typedef struct timespect{ 
time t tv sec; // 秒 
long tv nsex; // 纳 秒 
)timespec t; 
这 里 的 秒 和 纳 秒 数 是 自 1970 年 1 月 1 号 00:00:00 开始 到 现在 所 经 历 的 时 间 。 如 果 函 数 执行 成 
功 就 返回 0， 出 错 则 返回 错误 编号 。 


4. 唤醒 等 待 条 件 变量 的 线程 
pthread cond signal 用 于 唤醒 一 个 等 待 条 件 变量 的 线程 ， 该 函数 声明 如 下 : 
int pthread cond signal(pthread cond t *cond); 


其 中 ， 参 数 cond 指向 pthread cond t 类 型 变量 的 指针 ， 表 示 一 个 已 经 阻塞 线程 的 条 件 变量 。 
如 果 函 数 执行 成 功 就 返回 0， 出错 则 返回 错误 编号 。 

pthread cond signal 只 唤醒 一 个 等 待 该 条 件 变 量 的 线程 ， pthread_cond_broadcast 函数 则 将 唤 
醒 所 有 等 待 该 条 件 变 量 的 线程 ， 该 函数 声明 如 下 : 
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int pthread cond broadcast(pthread cond t *cond); 


其 中 ， 参 数 cond 指向 pthread cond t 类 型 变量 的 指针 ， 表 示 一 个 已 经 阻塞 线程 的 条 件 变量 。 
如 果 函 数 执行 成 功 就 返回 0， 出错 则 返回 错误 编号 。 


5. 条 件 变量 的 销毁 


当 不 再 使 用 条 件 变量 的 时 候 ， 


pthread_cond_destroy， 声 明 如 下 : 


int pthread cond destroy (pthread cond t *cond); 


其 中 ， 参 数 cond 指向 pthread cond t 类 型 变量 的 指针 ， 表 示 一 个 不 再 使 用 的 条 件 变量 。 如 果 
函数 执行 成 功 就 返回 0， 出 错 则 返回 错误 编号 。 
关于 条 件 变量 的 基本 函数 介绍 完了 ， 下 面 我 们 通过 例子 来 加 深 理解 。 
【 例 9.6】 找 出 1~20 中 能 整除 3 的 整数 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include 
#include 
#include 
#include 





<pthread.h> 
<stdio.h> 
<stdlib.h> 
<unistd.h> 


pthread mutex t mutex = PTHREAD MUTEX INITIALIZER; /* V]hhiL UH Je 8i» / 
pthread cond t cond = PTHREAD COND INITIALIZER; /* 初 始 化 条 件 变量 */ 


void *threadl(void *); 
void *thread2(void *); 


inti = 1; 
int main(void) 


t 


pthread t t a; 
pthread t t b; 


应 该 把 它 销 毁 。 用 于 销毁 条 件 变 量 的 函数 是 


pthread create(&t a, NULL, thread2, (void *)NULL) ;// 创 建 线 程 t_a 
pthread create(&t b, NULL, threadl, (void *)NULL); // 创 建 线程 t_b 
pthread join (t_b，NULL) ; /* 等 待 进程 t_b 结 束 */ 
pthread mutex destroy(&mutex); 
pthread cond destroy (&cond); 

exit (0); 


) 


void *threadl(void *junk) 


{ 


for (i 15 i <= 20; i++) 


t 


pthread mutex lock(&mutex);//9Kft H Jk Bi 
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if (i$ 3 == 0) 

pthread cond signal(&cond); // 唤 醒 等 待 条 件 变量 cond 的 线程 
else 

printf("theadl:$dWn", i); // 打 印 不 能 整除 3 的 i 
pthread mutex unlock(&mutex);// 解 锁 互 斥 锁 


sleep(1); 


) 


void *thread2(void *junk) 
t 

while (i « 20) 

t 


pthread mutex lock(&mutex); 


if (ài $& 3 !— 0) 

pthread cond wait (&cond, &mutex) ;// 等 待 条 件 变量 
printf("------------ thread2:$dWn", i); // 打 印 能 整除 3 的 i 
pthread mutex unlock(&mutex); 


sleep(1); 
itt; 


) 
(2) 上 传 testcpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -lpthread”， 其 中 pthread 
是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 


[root@localhost cpp98]# g++ -o test test.cpp -lpthread 
[root@localhost cpp98]# ./test 





theadl:1 
thead1:2 
ES thread2 :3 
thead1:5 
mccum thread2:6 
thead1:8 

----thread2:9 
theadl:10 
i thread2:12 
theadl:13 
OM E thread2:15 
theadl:16 
i thread2:18 
thead1:19 


上 例 中 ， 线 程 1 在 累加 i 的 过 程 中 ， 如 果 发 现 i 能 整除 3， 就 唤醒 等 待 条 件 变量 cond 的 线程 。 
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线程 2 在 循环 中 ,如 果 i 不 能 整除 3, 则 阻塞 线程 , 等 待 条 件 变量 .要 注意 的 是 , 由 于 pthread_cond_wait 
需要 释放 锁 ， 因 此 当 调用 pthread cond wait 的 时 候 ， 互 斥 锁 必 须 已 经 被 调用 线程 锁定 ， 线 程 2 中 
的 pthread_cond_wait 函数 前 会 先 加 锁 pthread_mutex_lock(&mutex)。 并 且 ，pthread_cond_wait 收 到 
条 件 变量 信号 时 ， 要 对 互 斥 锁 加 锁 ， 因 此 在 线程 1 中 的 pthread_cond_signal 后 面 解 锁 后 ， 才 会 让 线 
程 2 中 的 pthread_cond_wait 返回 ， 并 执行 它 后 面 的 语句 。 并 且 pthread cond wait 可 以 对 mutex 上 
锁 ， 当 用 完 i 的 时 候 ， 再 对 mutex 解锁 ， 这 样 可 以 让 线程 1 继续 进行 。 当 线程 1 打印 了 一 个 非 整除 
3 的 i 后， 就 休眠 〈sleep) 了 ， 此 时 将 切换 到 线程 2 的 执行 ， 线 程 发 现 i 不 能 整除 3， 就 阻塞 。 


9.4 C++11/14 中 的 线程 同步 


C++11/14 提供 了 两 种 方式 进行 线程 同步 ， 即 互 斥 锁 和 条 件 变 量 。 一 线 实 际 编程 中 用 的 较 多 的 
是 互 斥 锁 ，C++ll 中 的 条 件 变量 在 实际 编程 中 用 的 不 多 ， 这 里 不 再 次 述 。 

同 POSIX 线程 库 一 样 ，C++ll 也 提供 了 互 斥 锁 来 同步 线程 对 共享 资源 的 访问 ， 而 且 是 语言 级 
别 上 的 支持 。 我 们 知道 ， 互 斥 锁 是 线程 同步 的 一 种 机 制 ， 用 来 保护 多 线程 的 共享 资源 。 同 一 时 刻 ， 
只 允许 一 个 线程 对 临界 区 进行 访问 。 互 斥 锁 的 工作 流程 是 : 初始 化 一 个 互 斥 锁 ， 在 进入 临界 区 前 把 
互 斥 锁 加 锁 〈 防 止 其 他 线程 进入 临界 区 ) ， 退 出 临界 区 的 时 候 把 互 斥 锁 解锁 〈 让 别 的 线程 有 机 会 进 
入 临界 区 ) ， 最 后 不 用 互 斥 锁 的 时 候 就 销毁 它 。POSIX 库 中 用 类 型 pthread_mutex_t 来 定义 一 个 互 
斥 锁 ，pthread_mutex_t 是 一 个 联合 体 类 型 ， 定 义 在 pthreadtypes.h 中 。 

C++ 11 中 与 互 斥 锁 相关 的 类 (包括 锁 类 型 ) 和 函数 都 声明 在 头 文件 <mutex> 中 ， 如 果 需 要 使 用 互 
斥 锁 相 关 的 类 ， 就 必须 包含 头 文件 <mutex>。C++11 中 的 互 斥 锁 有 4 种， 并 对 应 着 4 种 不 同 的 类 。 


(1) 基本 互 斥 锁 ， 对 应 的 类 为 std::mutex。 

(2) 递归 互 斥 锁 ， 对 应 的 类 为 std::recursive_mutex。 
(3) 定时 互 斥 锁 ， 对 应 的 类 为 std::time_mutex。 
(4) 定时 递归 互 斥 锁 ， 对 应 的 类 std::time_mutex 。 


既然 是 互 斥 锁 ， 肯 定 有 上 锁 和 解锁 操作 了 ， 这 些 类 里 面 都 有 上 锁 的 成 员 函 数 lock、try_lock 以 
及 解锁 的 成 员 函 数 unlock。 

下 面具 体 介绍 基本 互 斥 锁 和 定时 互 斥 锁 。 

1. 基本 互 斥 锁 std::mutex 

类 std::mutex 是 最 基本 的 互 斥 锁 ， 用 来 同步 线程 对 临界 资源 的 互 斥 访问 。 它 的 成 员 函 数 如 表 
9-1 所 示 。 
































表 9-1 类 std::mutex 的 成 员 函 数 


EEEREN 
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函数 lock 用 来 对 一 个 互 斥 锁 上 锁 ， 如 果 互 斥 锁 当 前 没有 被 上 锁 ， 则 当前 线程 〈 调 用 线程 ， 调 
用 该 函数 的 线程 ) 可 以 成 功 对 互 斥 锁 上 锁 ， 即 当前 线程 拥有 互 斥 锁 ， 直 到 当前 线程 调用 解锁 函数 
unlock。 如 果 互 斥 锁 已 经 被 其 他 线程 上 锁 了 ， 则 当前 线程 挂 起 ， 直 到 互 斥 锁 被 其 他 线程 解锁 。 如 果 
互 斥 锁 已 经 被 当前 线程 上 锁 了 , 则 再 次 调用 该 函数 时 将 死 锁 ， 若 需要 递归 上 锁 ， 则 可 以 调用 成 员 函 
数 recursive mutex。 该 函数 声明 如 下 : 


void lock(); 


函数 unlock 用 来 对 一 个 互 斥 锁 解 锁 ， 释 放 调 用 线程 对 其 拥有 的 所 有 权 。 如 果 有 其 他 线程 因为 
要 对 互 斥 锁 上 锁 而 阻塞 着 , 则 互 斥 锁 被 调用 线程 解锁 后 ,阻塞 着 的 其 他 线程 就 可 以 继续 往 下 执行 了 ， 
即 能 对 互 斥 锁 上 锁 了 。 如 果 互 斥 锁 当 前 没有 被 调用 线程 上 锁 ， 则 调用 线程 调用 unlock 后 将 产生 不 
可 预知 结果 。 函 数 unlock 声明 如 下 : 


void unlock(); 
lock 和 unlock 都 要 被 调用 线程 配对 使 用 。 


【 例 9.7】 多 线程 统计 计数 器 到 10 万 
(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> // std::cout 
#include «thread» // std::thread 
#include <mutex> // std::mutex 


volatile int counter(0); // 定 义 一 个 全 局 变量 ， 当 作 计 数 器 ， 用 于 累加 
std: :mutex mtx; // 用 于 保护 counter 的 互 斥 锁 


void thrfunc() 
t 
for (int i = 0; i < 10000; ++i) 
t 
mtx.lock(; // 互 斥 锁 上 锁 
++counter; // 计 数 器 累加 
mtx.unlock(); // 互 斥 锁 解锁 


} 
int main(int argc, const char* argv[]) 
{ 


std: :thread threads[10]; 


for (int i - 0; i « 10; tti) 
threads[i] = std::thread(thrfunc); // 启 动 10 个 线程 


for (auto& th : threads) th.join(); // 等 待 10 个 线程 结束 
std::cout <<"count to "<< counter «« " successfully \n"; 
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return 0; 


} 


(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -Ipthread -std=c++11” , 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 





[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 
[root@localhost test]# ./test 
count to 100000 successfully 


2. 定时 互 斥 锁 std::time_mutex 
类 std:: time_mutex 是 定时 互 斥 锁 类 ， 和 基本 互 斥 锁 类 似 ， 用 来 同步 线程 对 临界 资源 的 互 斥 访 
问 ， 区 别 是 多 了 定时 。 它 的 成 员 函 数 如 表 9-2 所 示 。 
表 9-2 类 std: time_mutex 的 成 员 函 数 
ET 


try_lock 如 果 互 斥 锁 没 有 上 锁 ， 则 努力 上 锁 ， 但 不 阻塞 


try lock for 如 果 互 斥 锁 没有 上 锁 ， 则 努力 一 段 时 间 上 锁 ， 这 段 时 间 内 阻塞 ， 过 了 这 
段 时 间 就 退出 


try lock until 努力 上 锁 ， 直 到 某 个 时 间 点 ， 时 间 点 到 达 之 前 将 一 直 阻塞 
得 到 本 地 互 斥 锁 句柄 


函数 try_lock 尝试 锁 住 互 斥 锁 ， 如 果 互 斥 锁 被 其 他 线程 占有 ， 则 当前 线程 也 不 会 被 阻塞 , 线程 
调用 该 函数 会 出 现 3 种 情况 : @ 如 果 当 前 互 斥 锁 没 有 被 其 他 线程 占有 ， 则 该 线程 锁 住 互 斥 锁 ， 直 
到 该 线程 调用 unlock 释放 互 斥 锁 ; © 如 果 当 前 互 斥 锁 被 其 他 线程 锁 住 , 则 当前 调用 线程 返回 false, 
而 并 不 会 被 阻塞 掉 ，@@ 如 果 当 前 互 斥 锁 被 当前 调用 线程 锁 住 ， 则 会 产生 死 锁 。 该 函数 声明 如 下 : 





bool try lock(); // 注 意 有 下 画 线 

如 果 函 数 成 功 上 锁 ， 则 返回 true， 否 则 返回 false。 该 函数 不 会 阻塞 ， 不 能 上 锁 时 将 立即 返回 
false。 
【 例 9.8】 用 非 阻塞 上 锁 版 本 改写 上 例 

(1) 打开 UE， 新 建 一 个 test.cpp 文件 ， 在 test.cpp 中 输入 代码 : 


#include <iostream> // std::cout 
#include «thread» // std::thread 
#include «mutex^ // std::mutex 


volatile int counter(0); // 定 义 一 个 全 局 变量 ， 当 作 计 数 器 用 于 累加 
std: :mutex mtx; // 用 于 保护 counter 的 互 斥 锁 


void thrfunc() 
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for (int i = 0; i < 10000; ++i) 
if (mtx.try lock())// 互 斥 锁 上 锁 
**counter; // 计 数 器 累加 
mtx.unlock(); // 互 斥 锁 解锁 
Fa std::cout << "try lock false\n" ; 


int main(int argc, const char* argv[]) 
std: :thread threads[10]; 


for (int i = 0; i < 10; ++i) 
threads[i] = std::thread(thrfunc); // 启 动 10 个 线程 


for (auto& th : threads) th.join(); // 等 待 10 个 线程 结束 
std::cout << "count to " << counter << " successfully Wn"; 


return 0; 

) 

(2) 上 传 test.cpp 到 Linux， 在 终端 下 输入 命令 “g++ -o test test.cpp -Ipthread -std=c++11” , 
其 中 pthread 是 线程 库 的 名 字 ， 然 后 运行 test， 运 行 结果 如 下 : 

[root@localhost test]# g++ -o test test.cpp -lpthread -std=c++11 

[root@localhost test]# ./test 

count to 100000 successfully 

从 上 面 两 个 例子 可 以 看 出 , 当 临 界 区 的 代码 很 短 的 时 候 , 比如 只 有 “countert+;”, lock 和 try. lock 
的 效果 一 样 。 


9.5 ”线程 池 


9.5.1 ”线程 池 的 定义 

这 里 的 池 是 形象 的 说 法 。 线 程 池 就 是 有 一 堆 已 经 创建 好 了 的 线程 ， 初 始 都 处 于 空闲 等 待 状态 ， 
当 有 新 的 任务 需要 处 理 的 时 候 , 就 从 这 堆 线程 (这 堆 线程 比喻 为 线程 池 ) 中 取 一 个 空闲 等 待 的 线程 
来 处 理 该 任务 ， 当 任务 处 理 完毕 后 ， 就 再 次 把 该 线程 放 回 池 中 “一 般 就 是 将 线程 状态 置 为 空闲 ) ， 
以 供 后 面 的 任务 继续 使 用 。 当 池子 里 的 线程 全 都 处 于 忙碌 状态 时 ,线程 池 中 没有 可 用 的 空闲 等 待 线 
程 ,此 时 根据 需要 选择 创建 一 个 新 的 线程 并 置 入 池 中 , 或 者 通知 任务 当前 线程 池 里 所 有 线程 都 在 忙 ， 
等 待 片刻 再 尝试 。 这 个 过 程 可 以 用 图 9-2 来 表示 。 
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9.5.2 ”使 用 线程 池 的 原因 


信号 最 -1 


- 













zm 
执行 任务 
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工作 线程 


1 
执行 任务 


工作 线程 


工作 线程 


Win 


工作 线程 | nsns 


线程 的 创建 和 销毁 相对 于 进程 的 创建 和 销毁 来 说 是 轻 量 级 的 〈 开 销 没有 进程 那么 大 ) ， 但 是 
当 我 们 的 任务 需要 进行 大 量 线程 的 创建 和 销毁 操作 时 ， 这 些 开 销 合 在 一 起 就 比较 大 了 。 比 如 ， 当 你 
设计 一 个 压力 性 能 测试 框架 的 时 候 ， 需 要 连续 产生 大 量 的 并 发 操作 。 线程 池 在 这 种 场合 是 非常 适用 
的 。 线 程 池 的 好 处 就 在 于 线程 复 用 ， 某 个 线程 在 处 理 完 一 个 任务 后 ， 可 以 继续 处 理 下 一 个 任务 ， 而 
不 用 销毁 后 再 创建 ， 这 样 可 以 避免 无 谓 的 开销 ， 因 此 尤其 适用 于 连续 产生 大 量 并 发 任务 的 场合 。 


9.5.3 用 C++ 实现 一 个 简单 的 线程 池 


在 知道 了 线程 池 的 基本 概念 后 ， 下 面 我 们 用 Linux C++ 来 实现 一 个 基本 的 线程 池 ， 该 线程 池 虽 
然 简 单 ,但 可 以 体现 线程 池 的 基本 工作 思想 。 另 外 ,线程 池 的 实现 是 千变万化 的 ， 有 时 候 要 根据 实 
际 应 用 场合 来 定制 , 但 万 变 不 离 其 宗 ， 原 理 都 是 一 样 的 。 现 在 我 们 从 简单 的 、 基 本 的 线程 池 开 始 实 
践 ， 为 以 后 工作 中 设计 复杂 高 效 的 线程 池 做 准备 。 


【 例 9.9】 用 C++ 实现 一 个 简单 的 线程 池 
(1) 打开 UE 并 输入 如 下 代码 : 


#ifndef THREAD POOL H 
#define THREAD POOL H 


#include <vector> 
#include <string> 
#include <pthread.h> 


using namespace std; 


/* 执 行 任务 的 类 : 设置 任务 数据 并 执行 */ 
class CTask ( 
protected: 
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string m strTaskName;  // 任 务 的 名 称 
void* m ptrData; // 要 执行 的 任务 的 具体 数据 


public: 
CTask() = default; 
CTask(string &taskName) 
: m strTaskName (taskName) 
, m ptrData(NULL) {} 
virtual int Run() = 0; 
void setData(void* data);  // 设 置 任务 数据 


virtual ~CTask() {} 
}; 


/* 线 程 池 管 理 类 */ 

class CThreadPool { 

private: 
static vector«CTask*» m vecTaskList; // 任 务 列表 
static bool shutdown;  // 线 程 退出 标志 
int m iThreadNum;  // 线 程 池 中 启动 的 线程 数 
pthread t *pthread id; 


static pthread mutex t m pthreadMutex; // 线 程 同步 锁 
static pthread cond t m pthreadCond; < // 线 程 同 步 条 件 变量 


Protected: 
static void* ThreadFunc(void *threadData); // 新 线程 的 线程 回调 函数 
static int MoveToIdle(pthread t tid); ， // 线 程 执 行 结束 后 ， 把 自己 放 入 空闲 线程 中 
static int MoveToBusy(pthread t tid);  // 移 入 到 忙碌 线程 中 去 
int Create();  // 创 建 线程 池 中 的 线程 


Public: 
CThreadPool(int threadNum); 
int AddTask(CTask *task);  // 把 任务 添加 到 任务 队列 中 
int StopAll(); // 使 线程 池 中 的 所 有 线程 退出 
int getTaskSize(); // 获 取 当 前 任务 队列 中 的 任务 数 
] 


#endif 
(2) 保存 代码 为 头 文件 thread_pool.h， 再 新 建 一 个 thread_pool.cpp 文件 ， 并 输入 如 下 代码 : 


#include "thread pool.h" 
#include «cstdio» 


void CTask::setData(void* data) ( 


m ptrData = data; 
) 
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// BERRIE 

vector<CTask*> CThreadPool::m vecTaskList; 

bool CThreadPool::shutdown = false; 

pthread mutex t CThreadPool::m pthreadMutex - PTHREAD MUTEX INITIALIZER; 
pthread cond t CThreadPool::m pthreadCond - PTHREAD COND INITIALIZER; 


// 线 程 管理 类 构造 函数 

CThreadPool::CThreadPool(int threadNum) ( 
this-»m iThreadNum - threadNum; 
printf("I will create $d threads. Mn", threadNum); 
Create(); 


) 


// 线 程 回调 函数 
void* CThreadPool::ThreadFunc(void* threadData) ( 
pthread t tid - pthread self(); 
while (1) 
( 
pthread mutex lock(&m pthreadMutex); 
// 如 果 队 列 为 空 ， 等 待 新 任务 进入 任务 队列 
while (m vecTaskList.size() == 0 && !shutdown) 
pthread cond wait(&m pthreadCond, &m pthreadMutex); 


// 关 闭 线程 

if (shutdown) 

( 
pthread mutex unlock(&m pthreadMutex); 
printf("[tid: %$lu]\texit\n", pthread self()); 
pthread exit (NULL); 


printt(*rnEid: $TulN5rBn: $; td)s 
vector«CTask*»::iterator iter = m vecTaskList.begin(); 
// 取 出 一 个 任务 并 处 理 之 
CTask* task = *iter; 
if (iter !- m vecTaskList.end()) 
t 

task = *iter; 

m vecTaskList.erase (iter); 


pthread mutex unlock(&m pthreadMutex); 


task->Run ();  // 执 行 任务 
printf("[tid: $1u]NtidleWMn", tid); 


return (void*)0; 
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} 


// 往 任务 队列 里 添加 任务 并 发 出 线程 同步 信号 

int CThreadPool::AddTask(CTask *task) ( 
pthread mutex lock(&m pthreadMutex); 
m vecTaskList.push back(task); 
pthread mutex unlock(&m pthreadMutex); 
pthread cond signal(&m pthreadCond); 


return 0; 


) 


// 创 建 线程 
int CThreadPool::Create() { 
pthread id = new pthread t[m iThreadNum]; 
for (int i = 0; i < m iThreadNum; i++) 
pthread create(&pthread id[i], NULL, ThreadFunc, NULI); 


return 0; 


) 


// 停 止 所 有 线程 
int CThreadPool::StopAll() ( 
// 避 免 重复 调用 
if (shutdown) 
return -1; 
printf("Now I will end all threads! nin"); 


// 唤 醒 所 有 等 待 进程 ， 线 程 池 也 要 销毁 了 


shutdown = true; 
pthread cond broadcast (gm pthreadCond); 


// 清 理 僵尸 进程 
for (int i = 0; i < m iThreadNum; i++) 
pthread join(pthread id[i], NULL); 


delete[] pthread id; 
pthread id - NULL; 


// 销 毁 互 斥 锁 和 条 件 变 量 
pthread mutex destroy(&m pthreadMutex); 
pthread cond destroy(&m pthreadCond); 


return 0; 


B 


// 获 取 当 前 队列 中 的 任务 数 
int CThreadPool::getTaskSize() ( 
return m vecTaskList.size(); 


) 
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(3) 新 建 一 个 main.cpp， 输 入 如 下 代码 : 





#include "thread pool.h" 
#include «cstdio» 
#include <stdlib.h> 
#include <unistd.h> 


class CMyTask : public CTask { 
public: 
CMyTask() = default; 
int Run() ( 
printf("$sWin", (char*)m ptrData); 
int x - rand() $ 4 * 1; 
sleep(x); 
return 0; 
) 
^CMyTask() {} 


int main() ( 
CMyTask taskObj; 
char szTmp[] = "hello!"; 
taskObj.setData((void*)szTmp); 
CThreadPool threadpool(5); // 线 程 池 大 小 为 5 


for (int i = 0; i < 10; i++) 
threadpool.AddTask(&taskObj); 


while (1) ( 
printf("There are still $d tasks need to handleWMn", threadpool. 
getTaskSize()); 


// 任 务 队 列 已 没有 任务 了 
if (threadpool.getTaskSize() == 0) ( 
// 清 除 线程 池 
if (threadpool.StopAll() == -1) ( 
printf("Thread pool clear, exit.\n"); 
exit (0); 


H 
H 
sleep(2); 
printf("2 seconds later... Xn"); 
) 
return 0; 


) 
(4). 把 这 3 个 文件 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ thread pool.cpp test.cpp -o test -lpthread 
[rootélocalhost test]# ./test 

I will create 5 threads. 

There are still 10 tasks need to handle 

[tid: 139992529053440] run: hello! 

[tid: 139992520660736] run: hello! 
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itid: 
ieia: 
[tid: 


139992512268032] 
139992503875328] 
139992495482624] 


2 seconds later... 





itid; 


are still 5 tasks 


: 139992512268032] 


139992512268032] 
139992495482624] 
139992495482624] 
139992520660736] 
139992520660736] 
139992529053440] 


: 139992529053440] 


139992503875328] 
139992503875328] 


2 seconds later... 
There are still 0 tasks need to handle 
Now I will end all threads! 


icid; 
[tid: 





139992520660736 

139992520660736] 
139992495482624] 
139992495482624] 
139992512268032] 
139992512268032] 
139992529053440] 
139992529053440] 
139992503875328] 
139992503875328] 


2 seconds later... 
There are still 0 tasks need to handle 
Thread pool clear, exit. 


hello! 
hello! 
hello! 


run: 
run: 
run: 


need to handle 
idle 
run: 
idle 
run: 
idle 
run: 
idle 
run: 
idle 
run: 


hello! 


hello! 


hello! 


hello! 


hello! 


idle 
exit 
idle 
exit 
idle 
exit 
idle 
exit 
idle 
exit 
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10.1 库 的 基本 概念 


库 在 软件 开发 中 扮演 着 重要 的 角色 ， 尤 其 是 当 软 件 规模 较 大 的 时 候 ， 往 往 将 软件 划分 为 许多 
模块 ， 这 些 模块 各 自 提供 不 同 的 功能 ， 尤 其 是 一 些 通用 的 功能 ， 都 放 在 一 个 模块 里 ， 然 后 给 其 他 模 
块 来 调用 ， 这 样 可 以 避免 多 次 重复 开发 ， 提 高 效率 。 而 且 ， 在 多 人 开发 的 软件 项 目 中 ， 可 以 根据 模 
块 划分 来 进行 分 工 ， 比 如 指定 某 个 人 负责 开发 某 个 库 。 在 实际 的 软件 开发 中 ,对 于 一 些 需要 被 许多 
模块 反复 使 用 的 公共 代码 ， 我 们 通常 可 以 将 它们 编译 为 库 文件 。 

库 从 本 质 上 来 说 是 一 种 可 执行 代码 的 二 进 制 格式 , 可 以 被 载 入 内 存 中 执行 。 在 Linux 操作 系统 
中 ， 库 以 文件 的 形式 存在 ， 并 且 可 以 分 为 动态 链接 库 和 静态 链接 库 两 种 ,简称 动态 库 和 静态 库 。 静 
态 链接 库 文件 的 后 缀 名 是 .a， 动 态 链接 库 文件 以 .so 为 后 级 名 。 无 论 是 动态 链接 库 还 是 静态 链接 库 ， 
它们 无 非 向 其 调用 者 提供 变量 、 函 数 或 类 。 


10.2 ” 库 的 分 类 


Linux 下 的 库 有 两 种 : 静态 库 和 共享 库 (动态 库 ) 。 二 者 的 不 同 在 于 代码 被 载 入 的 时 刻 不 同 。 

静态 库 在 程序 编译 时 会 被 链接 到 目标 代码 中 ， 目 标 程序 运行 时 将 不 再 需要 该 动态 库 ， 移 植 方 
便 ， 体 积 较 大 ,但 是 浪费 空间 和 资源 ， 因 为 所 有 相关 的 对 象 文件 与 牵涉 到 的 库 被 链接 合成 一 个 可 执 
行文 件 ， 这 样 导致 可 执行 文件 的 体积 较 大 。 

动态 库 在 程序 编译 时 并 不 会 被 链接 到 目标 代码 中 ， 而 是 在 程序 运行 时 才 被 载 入 ， 因 此 可 执行 
文件 体积 较 小 。 有 了 动态 库 ， 程 序 的 升级 相对 变 得 比较 简单 ， 比 如 某 个 动态 库 升 级 了 ， 只 需要 更 换 
这 个 动态 库 文件 , 而 不 需要 去 更 换 可 执行 文件 。 但 要 注意 的 是 , 可 执行 程序 在 运行 时 需要 能 找到 动 
态 库 文件 。 可 执行 文件 是 动态 库 的 调用 者 。 
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10.3 静态 库 


10.3.1 静态 库 的 基本 概念 


静态 库 文件 的 后 绷 为 .a， 在 Linux 下 一 般 命名 为 libxxx.a。 当 有 程序 使 用 某 个 静态 库 时 ， 在 链 
接 步骤 中 , 链接 器 将 从 静态 库 文件 中 取得 的 代码 复制 到 生成 的 可 执行 文件 中 , 即 整个 库 中 的 所 有 函 
数 都 被 链接 到 可 执行 文件 中 。 因此 使 用 静态 库 的 可 执行 文件 通常 较 大 。 但 使 用 静态 库 的 优点 也 非常 
明显 , 即 可 执行 程序 最 终 运 行 时 不 需要 和 该 库 有 关 的 文件 的 支持 , 因为 所 有 使 用 的 函数 都 已 经 被 编 
译 进 去 了 ， 可 执行 文件 可 以 直接 运行 了 。 当 然 ， 有 时 候 这 也 是 一 个 缺点 ， 比 如 静态 库 里 的 内 容 改 变 
了 ， 那 么 你 的 程序 〈 调 用 者 ) 必须 要 重新 编译 。 


10.3.2 ”静态 库 的 创建 和 使 用 


通常 使 用 ar 命令 来 创建 静态 库 。 通 过 ar 命令 其 实 就 是 把 一 些 目标 文件 Coo 组 合 在 一 起 ， 成 
为 一 个 单独 的 静态 库 。Linux 上 创建 静态 库 的 步骤 如 下 : 


(1) 编辑 源 文件 〈 比 如 .c 或 .cpp 文件 ) 。 

(2) 通过 gee -cxxx.c 或 g++ -c xxx.cpp 生成 目标 文件 〈 即 .o 文件 ) 。 

G) 用 ar 归档 目标 文件 ， 生 成 静态 库 。 

(4) 配合 静态 库 写 一 个 头 文件 , 文件 里 的 内 容 就 是 提供 给 外 面 使 用 的 函数 、 变 量 或 类 的 声明 。 


要 学 会 创建 静态 库 ， 主 要 是 学 会 ar 命令 的 使 用 。ar 命令 不 但 可 以 创建 静态 库 ， 也 可 以 修改 或 
提取 已 有 静态 库 中 的 信息 。 它 的 常见 用 法 如 下 : 








ar [option] libxxx.a xxl.o xx2.0 xx3.o . 


其 中 ，option 是 ar 命令 的 选项 ， libxxx.a 是 生成 的 静态 库 文件 的 名 字 ，xxx 通常 是 我 们 自己 设 
定 的 名 字 ，lib 是 一 种 习惯 ， 静 态 库 通 常 以 lib 开头 ; 后 面 的 xxl1.o、xx2.o、xx3.o 是 要 归档 进 静 态 
库 中 的 目标 代码 文件 ， 可 以 有 多 个 ， 所 以 后 面 用 省 略 号 。 


常用 选项 如 下 : 

CD 选项 c 

用 来 创建 一 个 库 。 无 论 库 是 否 存在 ， 都 将 创建 。 
(2) 选项 s 


创建 目标 文件 索引 ， 这 在 创建 较 大 的 库 时 能 加 快 时 间 。 如 果 不 需 要 创建 索引 ， 可 改 成 大 写 S 
参数 ， 如 果 .a 文件 缺少 索引 ， 还 可 以 使 用 ranlib 命令 添加 。 


(D 选项 r 

在 库 中 插入 模块 ， 若 插入 的 模块 名 已 经 在 库 中 存在 ， 则 将 蔡 换 同名 的 模块 。 如 果 若 干 模块 中 
有 一 个 模块 在 库 中 不 存在 ，ar 就 会 显示 一 个 错误 消息 ， 并 不 会 蔡 换 其 他 同名 模块 。 默 认 情 况 下 ， 
新 的 成 员 增加 在 库 的 结尾 处 ， 可 以 使 用 其 他 任意 选项 来 改变 增加 的 位 置 。 
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(4) 选项 t 
显示 库 文件 中 有 哪些 目标 文件 。 注 意 ， 只 显示 名 称 。 


(5) 选项 tv 
显示 库 文件 中 有 哪些 目标 文件 。 显 示 的 信息 包括 文件 名 、 时 间 、 大 小 等 。 


(6) 选项 s 
显示 静态 库 文件 中 的 索引 表 。 
要 使 用 静态 库 很 简单 ， 下 面 我 们 来 看 一 个 小 例子 ， 生 成 一 个 静态 库 并 使 用 它 。 


【 例 10.1】 创 建 并 使 用 静态 库 ( g++ 版 ) 
(1) 打开 UE， 新 建 一 个 源 文件 test.cpp， 内 容 如 下 : 


#include <stdio.h> 

#include <iostream> 

using namespace std; 

void f(int age) 

t 
cout «« "your age is " «« age «« endl; 
printf("age:$dMn",age); 

) 


代码 很 简单 。 这 个 源码 文件 主要 作为 静态 库 。 我 们 首先 对 其 生成 test.o， 上 传 到 Linux， 在 命 
令 行 输 入 : 





[root@localhost test]# g++ -c test.cpp 
此 时 会 在 test.cpp 同 目录 下 生成 testo 目标 文件 ， 再 输入 命令 来 生成 静态 库 : 
[root@localhost test]# ar rcs libtest.a test.o 


其 中 ，ar 是 静态 函数 库 创建 的 命令 ，c 是 create (AE) 的 意思 ，rs 前 面 都 有 解释 。 
此 时 会 在 同 目录 下 生成 libtest.a 静态 库 文件 .注意 ,所 要 生成 的 .a 文件 的 名 字 前 3 位 最 好 是 lib, 
否则 在 链接 的 时 候 ， 就 可 能 导致 找 不 到 这 个 库 。 


(2) 现在 静态 库 生 成 了 ， 我 们 另外 编写 一 个 源 文 件 ， 来 使 用 该 库 中 的 函数 人 打开 UE， 然 后 
新 建 一 个 文件 main.cpp， 并 输入 代码 如 下 : 


extern void f(int age);  // 声 明 要 使 用 的 函数 
#include <iostream> 
using namespace std; 


int main(int argc, char *argv[]) 
t 
f(66); 
cout «« "HI" «« endl; 
return 0; 
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代码 很 简单 。 首 先 声 明 一 下 然后 就 可 以 在 main 函数 中 使 用 了 。 保 存 后 上 传 到 Linux， 注 意 
要 和 libtest.a 放 在 同一 个 目录 ， 然 后 在 命令 行进 行 编译 并 运行 : 

[root@localhost test]# g++ -o main main.cpp -L. -ltest 

[rootQlocalhost test]f ./main 

your age is 66 

age:66 

HI 

编译 运行 成 功 了 。 其 中 ，-L 用 来 告诉 g++ 去 哪里 找 库 文 件 ， 它 后 面 加 了 一 个 点 CO ， 表 示 在 
当前 目录 下 去 找 库 文件 ; -1 的 作用 是 用 来 指定 具体 的 库 ， 其 中 的 lib 和 .a 不 用 显 式 写 出 ，g++ 或 gec 
会 自动 去 寻找 libtest.a， 这 也 是 我 们 前 面 生成 静态 库 的 时 候 ， 静 态 库 的 文件 名 要 用 lib 前 级 的 原因 。 
默认 情况 下 ，g++ 或 gcc 会 首先 搜索 动态 库 (.so) 文件 ， 找 不 到 后 再 去 寻找 静态 库 (.a) 文件 。 当 
前 目录 没有 动态 库 文件 ， 因 此 可 以 找到 静态 库 文件 。 

gcc 和 g++ 使 用 静态 库 的 过 程 类 似 ， 下 面 列举 一 个 gee 版 本 的 例子 。 


【 例 10.2】 创 建 并 使 用 静态 库 ( gcc 版 ) 
CD 打开 UE， 新 建 一 个 源 文 件 testc， 内 容 如 下 : 








#include <stdio.h> 
void f(int age) 
t 
printf("age:$dWMn",age); 


) 

代码 很 简单 。 这 个 源码 文件 主要 作为 静态 库 。 我 们 首先 对 其 生成 test.o， 上 传 到 Linux， 在 命 
令 行 输入 : 

[root@localhost test]# gcc -c test.cpp 

此 时 会 在 test.cpp 同 目录 下 生成 testo 目标 文件 ， 再 输入 命令 来 生成 静态 库 : 


[root@localhost test]# ar rcs libtest.a test.o 
其 中 ，ar 是 静态 函数 库 创建 的 命令 ，c 是 create (OE) 的 意思 ，s 前 面 都 有 解释 。 
此 时 会 在 同 目录 下 生成 libtest.a 静态 库 文件 .注意 , 所 要 生成 的 .a 文件 的 名 字 前 3 位 最 好 是 lib, 
否则 在 链接 的 时 候 ， 就 可 能 导致 找 不 到 这 个 库 。 
(2) 现在 静态 库 生 成 了 ， 我 们 另外 编写 一 个 源 文件 ， 来 使 用 该 库 中 的 函数 f 打开 UE， 然 后 
新 建 一 个 文件 main.cpp， 并 输入 代码 如 下 : 


extern void f(int age);  // 声 明 要 使 用 的 函数 
int main(int argc, char *argv[]) 
t 


f(66); 
return 0; 
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) 


代码 很 简单 。 首 先 声 明 一 下 f, 然后 就 可 以 在 main 函数 中 使 用 了 。 保 存 后 上 传 到 Linux， 注 意 
要 和 libtest.a 放 在 同一 个 目录 ， 然 后 在 命令 行进 行 编译 并 运行 : 

[root@localhost test]# gcc -o main main.c -L. -ltest 

[rootélocalhost test]# ./main 

age:66 

编译 运行 成 功 了 。 其 中 ，-L 用 来 告诉 gec 去 哪里 找 库 文 件 ， 它 后 面 加 了 一 个 点 〈.) ， 表 示 在 
当前 目录 下 去 找 库 文件 ; -1 的 作用 是 用 来 指定 具体 的 库 ， 其 中 的 lib 和 .a 不 用 显 式 写 出 ，g++ 或 gcc 
会 自动 去 寻找 libtesta， 这 也 是 我 们 前 面 生成 静态 库 的 时 候 ， 静 态 库 的 文件 名 要 用 lib 前 级 的 原因 。 
默认 情况 下 ，g++ 或 gec 会 首先 搜索 动态 库 〈.so) 文件 ， 找 不 到 后 再 去 寻找 静态 库 Ca) 文件 。 当 
前 目录 没有 动态 库 文件 ， 因 此 可 以 找到 静态 库 文件 。 





10.4 动态 库 


10.4.1 动态 库 的 基本 概念 


动态 库 又 称 为 共享 库 。 这 类 库 的 名 字 一 般 是 libxxx.M.N.so， 同 样 ，xxx 为 库 的 名 字 ，M 是 库 
的 主 版 本 号 ，N 是 库 的 副 版 本 号 。 当 然 也 可 以 不 要 版 本 号 ， 但 名 字 必 须 有 ， 即 libxxx.so。 相 对 于 静 
态 函 数 库 , 动态 函数 库 在 编译 的 时 候 并 没有 被 编译 进 目标 代码 中 , 我 们 的 程序 执行 到 相关 函数 时 才 
调用 该 函数 库 里 的 相应 函数 , 因此 动态 函数 库 所 产生 的 可 执行 文件 比较 小 。 由 于 函数 库 没 有 被 整合 
进 你 的 程序 ， 而 是 程序 运行 时 动态 地 申请 并 调用 , 所 以 程序 的 运行 环境 中 必须 提供 相应 的 库 。 动 态 
函数 库 的 改变 并 不 影响 你 的 程序 ， 所 以 动态 函数 库 的 升级 比较 方便 。Linux 系统 有 几 个 重要 的 目录 
存放 相应 的 函数 库 ， 如 /lib /usr/lib。 

当 要 使 用 静态 的 程序 库 时 ， 连 接 器 会 找 出 程序 所 需 的 函数 ， 然 后 将 它们 复制 到 执行 文件 ， 由 
于 这 种 复制 是 完整 的 ， 因 此 一 旦 连接 成 功 ， 静 态 程序 库 也 就 不 再 需要 了 。 然 而 ， 对 动态 库 而 言 ， 就 
不 是 这 样 的 。 动 态 库 会 在 执行 程序 内 留 下 一 个 标记 ,指明 当 程 序 执行 时 ， 首 先 必须 载 入 这 个 库 。 由 
于 动态 库 节 省 空间 ，Linux 下 进行 连接 的 默认 操作 是 首先 连接 动态 库 ， 也 就 是 说 ， 如 果 同 时 存在 静 
态 和 动态 库 ， 不 特别 指定 的 话 ， 将 与 动态 库 相 连接 。 

10.4.2 ”动态 库 的 创建 和 使 用 

动态 库 文件 的 后 缀 为 .so， 可 以 直接 使 用 gec 或 g++ 生成 。 下 面 来 看 一 个 例子 。 
【 例 10.3】 创 建 和 使 用 动态 库 

打开 UE， 新 建 一 个 源 文件 test.cpp， 内 容 如 下 : 

#include <stdio.h> 


#include <iostream> 
using namespace std; 
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void f(int age) 

t 
cout «« "your age is " «« age «« endl; 
printf("age:$dWMn",age); 

) 


代码 很 简单 。 这 个 源码 文件 主要 作为 动态 库 。 把 文件 上 传 到 Linux， 在 命令 行 输入 : 
[root@localhost test]# g++ test.c -fPIC -shared -o libtest.so 


此 时 会 在 同 目录 下 生成 动态 库 文件 libtestso。 上面 命令 行 中 的 -shared 表明 产生 共享 库 , 而 -fPIC 
则 表明 使 用 地 址 无 关 代 码 。PIC 的 全 称 是 Position Independent Code。 在 Linux 下 编译 共享 库 时 ， 必 
须 加 上 -fPIC 参数 ， 否 则 在 链接 时 会 有 错误 提示 。 那么 fPIC 的 目的 是 什么 ? 共享 库 文件 可 能 会 被 不 
同 的 进程 加 载 到 不 同 的 位 置 上 ， 如 果 共 享 对 象 中 的 指令 使 用 了 绝对 地 址 、 外 部 模块 地 址 ,那么 在 共 
享 对 象 被 加 载 时 就 必须 根据 相关 模块 的 加 载 位 置 对 这 个 地 址 做 调整 ,也 就 是 修改 这 些 地址 , 让 它 在 
对 应 进程 中 能 正确 访问 , 这 样 就 不 能 实现 多 进程 共享 一 份 物 理 内 存 , 共享 库 在 每 个 进程 中 都 必须 有 
一 份 物 理 内 存 的 复制 。fPIC 指令 就 是 为 了 让 使 用 同一 个 共享 对 象 的 多 个 进程 能 尽 可 能 多 地 共享 物 
理 内 存 , 它 背 后 把 那些 涉及 绝对 地 址 、 外 部 模块 地 址 访问 的 地 方 都 抽 离 出 来 ， 保 证 代码 段 的 内 容 可 
以 多 进程 相同 ， 实 现 共享 。 这 些 内 容 了 解 即 可 。 总 之 ，-fPIC (或 -fpic) 表示 编译 为 位 置 独立 的 代 
码 。 位 置 独立 的 代码 即位 置 无 关 代码 ,在 可 执行 程序 加 载 的 时 候 可 以 存放 在 内 存 中 的 任何 位 置 。 若 
不 使 用 该 选项 , 则 编译 后 的 代码 是 位 置 相关 的 代码 ,在 可 执行 程序 加 载 时 ,通过 代码 复制 的 方式 来 
满足 不 同 进程 的 需要 ， 没 有 实现 真正 意义 上 的 位 置 共享 。 

动态 库 产 生 后 ， 我 们 就 可 以 使 用 动态 库 了 ， 下 面 先 编写 一 个 主 函 数 。 打 开 UE， 然 后 新 建 一 个 
文件 main.cpp， 并 输入 代码 如 下 : 


extern void f(int age);  // 声 明 要 使 用 的 函数 
#include <iostream> 
using namespace std; 





int main(int argc, char *argv[]) 
t 

£(66); 

cout << "HI" << endl; 


return 0; 


} 


代码 很 简单 。 首 先 声 明 一 下 f, 然后 就 可 以 在 main 函数 中 使 用 了 。 保 存 后 上 传 到 Linux， 注 意 
要 和 libtesta 放 在 同一 个 目录 ， 然 后 在 命令 行进 行 编译 并 运行 : 
[root@localhost test]# g++ main.c -o main -L ./ -ltest 


其 中 ，-L 用 来 告诉 g++ 去 哪里 找 库 文件 ， 它 后 面 加 了 空格 和 ./ 表 示 在 当前 目录 下 寻找 库 ， 或 者 
直接 写 -L. 即 可 ; -! 的 作用 是 用 来 指定 具体 的 库 ， 其 中 的 lib 和 .so 不 用 显 式 写 出 ，g++ 会 自动 去 寻找 
libtest.so。 默 认 情 况 下 ，g++ 或 gcc 会 首先 搜索 动态 库 〈.so) 文件 ， 找 不 到 后 再 去 寻找 静态 库 Ca) 
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文件 。 当 前 目录 下 以 test 命名 的 库 文 件 有 动态 库 文件 〈libtestso)， 因 此 g++ 可 以 找到 。 

编译 链接 后 ， 会 在 当前 目录 下 生成 可 执行 文件 main， 如 果 此 时 运行 ， 会 发 现 运行 不 了 : 

[root@localhost test]# ./main 

./main: error while loading shared libraries: libtest.so: cannot open shared 
object file: No such file or directory 

这 是 为 什么 呢 ? 看 提示 似乎 是 main 程序 找 不 到 libtestso, 但 是 main 文件 和 libtest.so 都 在 同一 
目录 下 。 虽 然 我 们 知道 它们 在 同一 目录 下 ， 但 程序 main 并 不 知道 。 那 怎么 办 呢 ? 把 动态 库 放 到 默 
认 的 搜索 路 径 上 或 者 告诉 系统 动态 库 的 路 径 即 可 ， 有 以 下 3 种 方法 。 


第 一 种 ， 将 库 复制 到 /usr/lib 和 /lib (不 包含 子 目录 ) F- 
这 两 个 路 径 是 默认 搜索 的 地 方 ， 但 要 注意 的 是 ， 把 动态 库 放 到 这 两 个 目录 之 一 后 ， 要 执行 命 
4 ldconfig， 否 则 还 是 会 提示 找 不 到 。 现 在 我 们 把 libtest.so 剪 切 到 /usrlib: 


[root@localhost test]# mv libtest.so /usr/local/lib 
移动 后 ， 当 前 目录 下 就 没有 libtest.so 了 ， 然 后 执行 ldconfig 后 再 运行 main: 


[root@localhost test]# ldconfig 

[root@localhost test]# ./main 

age:66 

HI 

很 多 开源 软件 通过 源码 包 进行 安装 时 ， 如 果 不 指定 --prefix， 就 会 将 库 安 装 在 /usrlocallib 目录 
下 ， 当 运行 程序 需要 链接 动态 库 时 ， 提 示 找 不 到 相关 的 .so 库 ， 进 而 报错 。 也 就 是 说 ，/usr/local/lib 
目录 不 在 系统 默认 的 库 搜索 目录 中 。 

第 二 种 ， 在 命令 前 加 环境 变量 。 

如 果 第 一 种 方法 做 了 ， 则 我 们 首先 把 /usr/lib 或 /lib 下 的 libtest.so 删除 : 


[root@localhost lib]£ cd /usr/lib 
[root@localhost lib]# rm -f libtest.so 


再 回 到 /zwwltest 下 重新 生成 一 个 libtest.so， 然 后 加 环境 变量 后 运行 main: 


[root@localhost test]# g++ test.cpp -fPIC -shared -o libtest.so 
[root@localhost test]# LD LIBRARY PATH-/zww/test ./main 


age:66 

HI 

可 以 看 到 ， 我 们 把 动态 库 libtest.so 的 路 径 /zww/test 赋值 给 了 环境 变量 LD_LIBRARY_PATH, 
然后 运行 main 就 成 功 了 。 这 种 方法 虽然 简单 ， 但 该 环境 变量 只 对 当前 命令 有 效 ， 当 该 命令 执行 完 
成 后 ， 该 环境 变量 就 无 效 了 ， 除 非 每 次 执行 main 都 这 样 加 环境 变量 。 此 法 只 能 是 时 法 ， 要 想 采用 
永久 法 ， 可 以 参考 第 3 种 方法 。 


第 三 种 ， 修 改 /etc/ld.so.conf 文件 。 
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我 们 可 以 把 自己 的 动态 库 文件 的 路 径 加 到 /etc/1d.so.conf P, 这 个 文件 叫 动态 库 配 置 文件 , 接着 
执行 ltconfig， 然 后 系统 可 以 把 我 们 添加 的 路 径 作 为 其 默认 的 搜索 路 径 ， 一 劳 永 逸 。 


[root@localhost test]# vi /etc/ld.so.conf 


然后 在 该 文件 末尾 新 起 一 行 加 入 我 们 的 库 路 径 : /zww/test/, 保存 并 关闭 .此 时 查看 /etc/ld.so.conf 
的 内 容 为 : 
[root@localhost test]# cat /etc/ld.so.conf 


include ld.so.conf.d/*.conf 
/zww/test/ 


其 中 ， 第 一 行 原来 就 有 。 
现在 开始 执行 main: 


[root@localhost test]# ./main 

age: 66 

HI 

可 以 发 现 执行 成 功 了 。 我 们 也 可 以 把 libtest.so 放 到 任意 目录 ， 然 后 添加 任意 目录 的 路 径 到 
/etc/ld.so.conf， 发 现 再 也 不 用 担心 main 找 不 到 ibtestso 了 。 比 如 现在 把 libtest.so 放 到 /root/ 下 ， 并 
执行 main: 

[root@localhost test]# mv libtest.so /root 

[root@localhost test]# ./main 

./main: error while loading shared libraries: libtest.so: cannot open shared 
object file: No such file or directory 

预料 之 中 ，main 找 不 到 libtest.so， 因 为 /zww/test 下 没有 了 。 我 们 来 修改 /etc/ld.so.conf， 把 /root 
添加 进去 ， 添 加 后 的 内 容 如 下 : 

[root@localhost test]# cat /etc/ld.so.conf 


include ld.so.conf.d/*.conf 
/root 


再 执行 ldconfig， 然 后 执行 main: 


[root@localhost test]# ldconfig 

[root@localhost test]# ./main 

age:66 

HI 

执行 成 功 了 。 值 得 注意 的 是 ， 每 次 修改 /etc/ld.so.conf 后 ， 都 要 执行 ldconfig, ldconfig 命令 的 
用 途 主要 是 在 默认 搜寻 目录 Clib 和 /usrlib) 以 及 动态 库 配 置 文件 /etc/ld.so.conf 内 所 列 的 目录 下 ， 
搜索 出 可 共享 的 动态 链接 库 〈 格 式 如 前 面 介绍 的 lib*.so* ) ， 进 而 创建 出 动态 装 入 程序 Cld.so FEF) 
所 需 的 连接 和 缓存 文件 。 缓 存 文件 默认 为 /etc/ld.so.cache， 此 文件 保存 已 排 好 序 的 动态 链接 库 的 名 
字 列 表 。 





Linux 下 的 库 #10% 





【 例 10.4】 多 个 文件 生成 动态 库 
打开 UE， 新 建 一 个 源 文件 testl.cpp， 内 容 如 下 : 


#include <iostream> 
using namespace std; 
void fl(int age) 

t 


cout «« "this is libtestl.so: " «« age «« endl; 


) 
保存 后 ， 再 新 建 一 个 源 文件 test2.cpp， 内 容 如 下 : 


#include <iostream> 
using namespace std; 
void f2(int age) 

t 


cout «« "this is libtest2.so: " «« age «« endl; 


) 
代码 很 简单 。 这 2 个 源码 文件 主要 作为 动态 库 。 把 文件 上 传 到 Linux， 在 命令 行 输 入 : 
[rootélocalhost test]# g++ testl.cpp test2.cpp -fPIC -shared -o libtest.so 
此 时 会 在 同 目录 下 生成 动态 库 文件 libtest.so， 然 后 编译 main: 

[root@localhost test]# g++ main.cpp -L. -ltest -o main 

此 时 把 /zww/test 路 径 加 入 动态 库 配置 文件 /etc/ld.so.conf 中 ， 加 入 后 内 容 如 下 : 


[root@localhost test]# cat /etc/ld.so.conf 
include ld.so.conf.d/*.conf 
/zww/test 


执行 ldconfig 后 再 执行 main: 


[root@localhost test]# ldconfig 
[root@localhost test]# ./main 
this is libtestl.so: 65 

this is libtest2.so: 66 

bye 


运行 成 功 了 。 其 实 多 个 文件 组 成 库 的 过 程 和 一 个 文件 类 似 , 只 是 编译 库 的 时 候 多 加 一 个 源 文件 
而 已 。 
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本 章 讲 述 Linux 网 络 编程 所 需 的 基础 理论 概念 ， 这 是 一 个 很 广 的 话题 , 如果 要 全 面 论述 , 根本 
不 可 能 在 一 章 里 讲 完 。 本 章 将 主要 讲解 Linux 网 络 编程 中 经 常 涉及 的 TCP/IP 概念 等 。 


11.1 什么 是 TCP/IP 


TCP/IP 是 Transmission Control Protocol/Internet Protocol 的 简写 ， 中 文 译名 为 传输 控制 协议 / 因 
特 网 互联 协议 , 又 名 网 络 通信 协议 , 是 Internet 最 基本 的 协议 , Internet 国际 互联 网 络 的 基础 . TCP/IP 
协议 不 是 指 一 个 协议 , 也 不 是 TCP 和 IP 这 两 个 协议 的 合 称 , 而 是 一 个 协议 簇 , 包括 多 个 网 络 协议 ， 
比如 IP 协 议 、IMCP 协议 、TCP 协议 以 及 我 们 更 加 熟悉 的 HTTP 协议 、FTP 协议 、POP3 协议 等 。 
TCP/IP 定义 了 计算 机 操作 系统 如 何 连 入 因特网 ， 以 及 数据 如 何在 它们 之 间 传 输 的 标准 。 

TCP/IP 协议 是 为 了 解决 不 同系 统 的 计算 机 之 间 的 传输 通信 而 提出 的 一 个 标准 ， 不 同系 统 的 计 
算 机 采用 了 同一 种 协议 后 ， 就 能 相互 进行 通信 ， 从 而 建立 网 络 连接 ， 实 现 资源 共享 和 网 络 通信 。 就 
像 两 个 不 同 语言 国家 的 人 ， 都 用 英语 说 话 后 ， 就 能 相互 交流 了 。 


11.2 TCP/IP 协议 的 分 层 结构 


TCP/IP 协议 簇 按照 层次 由 上 到 下 可 以 分 成 4 层 ， 分 别 是 应 用 层 、 传 输 层 、 网 际 层 和 网 络 接口 
层 。 其 中 , 应 用 层 (Application Layer) 包 含 所 有 的 高 层 协议 , 比如 虚拟 终端 协议 (Telecommunications 
Network, TELNET) 、 文 件 传输 协议 (File Transfer Protocol, FTP) 、 电 子 邮 件 传输 协议 (Simple 
Mail Transfer Protocol, SMTP) 、 域 名 服务 (Domain Name Service, DNS) 、 网 上 新 闻 传 输 协 议 (Net 
News Transfer Protocol, NNTP) 和 超 文本 传送 协议 (HyperText Transfer Protocol, HTTP) 等 .TELNET 
允许 一 台 机 器 上 的 用 户 登录 到 远程 机 器 上 , 并 进行 工作 ; FTP 提供 有 效 地 将 文件 从 一 台 机 器 上 移 到 
另 一 台 机 器 上 的 方法 :1 SMTP 用 于 电子 邮件 的 收发 ， DNS 用 于 把 主机 名 映射 到 网 络 地 址 ; NNTP 
用 于 新 闻 的 发 布 、 检 索 和 获取 ; HTTP 用 于 在 WWW 上 获取 主页 。 

应 用 层 的 下 面 一 层 是 传输 层 (Transport Layer?) ， 著 名 的 TCP 协议 和 UDP 协议 就 在 这 一 层 。 
TCP 协议 (Transmission Control Protocol， 传 输 控制 协议 ) 是 面向 连接 的 协议 ， 它 提供 可 靠 的 报 文 
传输 和 对 上 层 应 用 的 连接 服务 。 为 此 ， 除 了 基本 的 数据 传输 外 ， 它 还 有 可 靠 性 保证 、 流 量 控制 、 多 
路 复 用 、 优 先 权 和 安全 性 控制 等 功能 。UDP 协议 (User Datagram Protocol， 用 户 数 据 报 协议 ) 是 面 
向 无 连接 的 不 可 靠 传输 的 协议 ， 主 要 用 于 不 需要 TCP 的 排序 和 流量 控制 等 功能 的 应 用 程序 。 

传输 层 的 下 面 一 层 是 网 际 层 〈Internet Layer, HEK Internet 层 或 网 络 层 ) ， 该 层 是 整个 TCP/IP 
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体系 结构 的 关键 部 分 ， 其 功能 是 使 主机 可 以 把 分 组 发 往 任 何 网 络 ， 并 使 分 组 独立 地 传 向 目标 。 这 些 
分 组 可 能 经 由 不 同 的 网 络 ， 到 达 的 顺序 和 发 送 的 顺序 也 可 能 不 同 。 互 联网 层 使 用 的 协议 有 IP. 协议 
(Internet Protocol， 因 特 网 协议 ) 。 

网 络 层 下 面 是 网 络 接口 层 (Network Interface Layer) ， 或 称 数据 链 路 层 ， 该 层 是 整个 体系 结构 
的 基础 部 分 , 负责 接收 IP 层 的 IP 数据 包 , 通过 网 络 向 外 发 送 ; 或 接收 处 理 从 网 络 上 传 来 的 物理 帧 ， 
抽出 IP 数据 包 ， 向 IP 层 发 送 。 该 层 是 主机 与 网 络 的 实际 连接 层 。 链 路 层 下 面 就 是 实体 线路 了 〈 比 
如 以 太 网 络 、 光 纤 网 络 等 )。 链 路 层 有 以 太 网 、 令 有 牌 环 网 等 标准 ， 链 路 层 负责 网 卡 设备 的 驱动 、 帧 
同步 (就 是 从 网 线 上 检测 到 什么 信号 算 作 新 帧 的 开始 ) 、 冲 突 检测 (如 果 检 测 到 冲突 就 自动 重 发 )、 
数据 差错 校 验 等 工作 。 交换机 是 工作 在 链 路 层 的 网 络 设备 , 可 以 在 不 同 的 链 路 层 网 络 之 间 转 发 数据 
帧 (比如 十 兆 以 太 网 和 百 兆 以 太 网 之 间 、 以 太 网 和 令 牌 环 网 之 间 )， 由 于 不 同 链 路 层 的 帧 格式 不 同 ， 
因此 交换 机 要 将 进来 的 数据 包 拆 掉 链 路 层 首部 重新 封装 之 后 再 转发 。 

不 同 的 协议 层 对 数据 包 有 不 同 的 称谓 ， 在 传输 层 叫 作 段 〈segment) ， 在 网 络 层 叫 作 数据 报 
(Cdatagram) ， 在 链 路 层 叫 作 帧 Cframe) 。 数 据 封 装 成 帧 后 发 到 传输 介质 上 ， 到 达 目 的 主机 后 ， 
每 层 协议 再 剥 掉 相应 的 首部 ， 最 后 将 应 用 层 数 据 交 给 应 用 程序 处 理 。 
不 同 层 包含 不 同 的 协议 ， 我 们 可 以 用 图 11-1 来 表示 各 个 协议 及 其 所 在 的 层 。 


















网 络 接口 层 





在 主机 发 送 端 ， 从 传输 层 开始 ， 会 把 上 一 层 的 数据 加 上 一 个 报头 形成 本 层 的 数据 ， 这 个 过 程 
叫 数据 封装 ， 如 图 11-2 所 示 。 在 主机 接收 端 ， 从 最 下 层 开始 ， 每 一 层 数据 会 去 掉 首 部 信息 ， 该 过 
程 叫 作 数据 解 封 。 


应 用 层 用 户 数据 字 节 流 











传输 层 用 户 数据 TCP 报 文 段 
i 1 
网 际 层 [ ds | TCP 报 文 也 | JP 数据 报 或 分 组 
LU 1 
网 络 接 入 层 ed IP 数 据 报 网 络 级 分 组 或 帧 
图 11-2 


我 们 以 浏览 某 个 网 页 为 例 ， 看 看 浏览 网 页 的 过 程 中 ，TCP/PP 各 层 做 了 哪些 工作 。 
发 送 方 : 
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CD 打开 浏览 器 ， 输 入 网 址 : www.xxx.com， 按 回 车 键 ， 访 问 网 页 ， 其 实 就 是 访问 Web 服务 
器 上 的 网 页 ， 在 应 用 层 采用 的 是 HTTP 协议 ， 浏 览 器 将 网 址 等 信息 组 成 HTTP 数据 ,并 将 数据 送 给 
下 一 层 传输 层 。 

(2) 传输 层 在 数据 前 面 加 上 TCP 首部 ， 并 标记 端口 为 80 CWeb 服务 器 默认 端口 ) ， 将 这 个 
数据 段 送 给 下 一 层 网 络 层 。 

G) 网 络 层 在 这 个 数据 段 前 面 加 上 自己 机 器 的 耳 和 目的 IP, 这 时 这 个 段 被 称 为 了 了 数据 包 (也 
可 以 称 为 报 文 ) ， 然 后 将 这 个 IP 包 送 给 下 一 层 网 络 接口 层 。 

(4) 网 络 接口 层 先 在 IP 数据 包 前 面 加 上 自己 机 器 的 MAC 地 址 以 及 目的 MAC 地 址 ， 这 时 加 
上 MAC 地 址 的 数据 称 为 帧 ， 网 络 接口 层 通过 物理 网 卡 将 这 个 帧 以 比特 流 的 方式 发 送 到 网 络 上 。 


互联 网 上 有 路 由 器 ， 它 会 读 取 比 特 流 中 的 IP 地 址 进行 选 路 ， 到 达 正 确 的 网 段 ， 之 后 这 个 网 段 
的 交换 机 读 取 比 特 流 中 的 MAC 地 址 ， 找 到 对 应 要 接收 的 机 器 。 
接收 方 : 


a) 网 络 接口 层 用 网 卡 接收 到 比特 流 ， 读 取 比 特 流 中 的 帧 ， 将 帧 中 的 MAC 地 址 去 掉 ， 就 成 
T IP 数据 包 ， 传 递 给 上 一 层 网 络 层 。 

C20 网 络 层 接收 到 下 层 传 上 来 的 卫 数据 包 , 将 IP 从 包 的 前 面 拿 掉 , 取出 带 有 TCP 的 数据 ( 数 
据 段 ) 交 给 传输 层 。 

(3) 传输 层 拿 到 这 个 数据 段 ， 看 到 TCP 标记 的 端口 是 80 端口 ， 说 明 应 用 层 协议 是 HTTP 协 
议 ， 之 后 将 TCP 头 去 掉 并 将 数据 交 给 应 用 层 ， 告 诉 应 用 层 对 方 要 求 的 是 HTTP 的 数据 。 

(4) 应 用 层 发 送 方 请 求 的 是 HTTP 数据 ， 就 调用 Web 服务 器 程序 ， 把 www.xxx.com 的 首页 
文件 发 送 回去 。 


如 果 两 台 计算 机 在 不 同 的 网 段 中 , 那么 数据 从 一 台 计算 机 到 另 一 台 计 算 机 的 传输 过 程 要 经 过 一 
个 或 多 个 路 由 器 。 跨 路 由 器 通信 过 程 如 图 11-3 所 示 。 




















图 11-3 
目的 主机 收 到 数据 包 后 , 如 何 经 过 各 层 协议 栈 最 后 到 达 应 用 程序 呢 ? 整个 过 程 如 图 11-4 所 示 。 


.452 。 
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- SUBE 应 用 程序 [see] 


根据 TCP 或 UDP 首 
部 中 的 端口 号 进 
行 分 用 













根据 IP 首 部 中 的 
帧 类 型 值 进行 分 用 





根据 以 太 网 首部 中 的 
帧 类 型 进行 分 用 





A Bit 


图 11-4 


以 太 网 驱动 程序 首先 根据 以 太 网 首部 中 的 “上 层 协议 ”字段 确定 该 数据 帧 的 有 效 载荷 (payload， 
指 除 去 协议 首部 之 外 实际 传输 的 数据 ) 是 IP. ARP 还 是 RARP 协议 的 数据 报 ， 然 后 交 给 相应 的 协 
议 处 理 。 假 如 是 IP 数据 报 ，IP 协议 再 根据 IP 首部 中 的 “上 层 协议 ”字段 确定 该 数据 报 的 有 效 载 荷 
是 TCP、UDP、ICMP 还 是 IGMP， 然 后 交 给 相应 的 协议 处 理 。 假 如 是 TCP 段 或 UDP 段 ，TCP 或 
UDP 协议 再 根据 TCP 首部 或 UDP 首部 的 “端口 号 ”字段 确定 应 该 将 应 用 层 数据 交 给 哪个 用 户 进 
程 。IP 地 址 是 标识 网 络 中 不 同 主机 的 地 址 ， 而 端口 号 是 同一 台 主机 上 标识 不 同 进程 的 地 址 ，IP 地 
址 和 端口 号 合 起 来 标识 网 络 中 唯一 的 进程 。 

注意 , 虽然 IP、ARP 和 RARP 数据 报 都 需要 以 太 网 驱动 程序 来 封装 成 帧 , 但 是 从 功能 上 划分 ， 
ARP 和 RARP 属于 链 路 层 ，IP 属于 网 络 层 。 虽 然 ICMP、IGMP、TCP、UDP 的 数据 都 需要 IP 协 
议 来 封装 成 数据 报 ， 但 是 从 功能 上 划分 ，ICMP、IGMP 5 IP 同属 于 网 络 层 ，TCP 和 UDP 属于 传 

下 面 用 一 张 图 来 总 结 一 下 TCP/IP 协议 模型 对 数据 的 封装 ， 如 图 11-5 所 示 。 


[€— — ——— MAC 的 总 长 度 







| 一 一 一 IP 的 总 长 度 
| 一 ”TCP 的 总 长 度 























MAC 包 头 | IP 包 头 | TCP 包 头 数据 以 太 网 尾部 
14 20 20 4 
图 11-5 
11.3 ”应 用 层 


应 用 层 位 于 TCP/IP 最 高 层 ， 该 层 的 协议 主要 有 以 下 几 种 : 
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CD 远程 登录 协议 〈Telnet) 。 

(2) 文件 传送 协议 (File Transfer Protocol，FTP) 。 

QD 简单 邮件 传送 协议 (Simple Mail Transfer Protocol, SMTP) 。 

(4) 域名 系统 (Domain Name System，DNS) 。 

(5) 简单 网 络 管理 协议 (Simple Network Management Protocol, SNMP) . 
(6) 超 文本 传送 协议 (Hyper Text Transfer Protocol, HTTP) 。 

CD 邮局 协议 (POP3) 。 


其 中 ， 从 网 络 上 下 载 文件 时 使 用 的 是 FTP 协议 ， 上 网 浏览 网 页 时 使 用 的 是 HTTP 协议 ; 在 网 
络 上 访问 一 台 主机 时 ， 通常 不 直接 输入 IP 地 址 ， 而 是 输入 域名 ， 用 的 是 DNS 服务 协议 ， 它 会 将 域 
名 解析 为 IP 地 址 ; 通过 outlook 发 送 电 子 邮 件 时 ， 使 用 SMTP 协议 ,接收 电子 邮件 时 会 使 用 POP3 
协议 。 


— 


11.3.1 DNS 


因特网 上 的 主机 通过 IP 地 址 来 标识 自己 , 但 由 于 IP 地 址 是 一 串 数字 , 用 这 个 数字 去 访问 主机 
比较 难 记 ， 因 此 ， 因 特 网 管理 机 构 又 采用 了 一 串 英文 来 标识 一 个 主机 ， 这 串 英文 是 有 一 定 规则 的 ， 
它 的 专业 术语 叫 域名 (Domain Name) 。 对 用 户 来 讲 ， 用 户 访问 一 个 网 站 的 时 候 ， 既 可 以 输入 该 网 
站 的 耳 地 址 ， 也 可 以 输入 其 域名 ， 对 访问 而 言 两 者 是 等 价 的 。 例 如 ， 微 软 公司 的 Web 服务 器 的 域 
名 是 www.microsoft.com， 无 论 用 户 在 浏览 器 中 输入 的 是 www.microsoft.com， 还 是 Web 服务 器 的 
IP 地址 ， 都 可 以 访问 其 Web 网 站 。 

域名 由 因特网 域名 与 地 址 管理 机 构 CInternet Corporation for Assigned Names and Numbers, 
ICANN) 管理 ， 这 是 为 承担 域名 系统 管理 、IP 地 址 分 配 、 协 议 参数 配置 以 及 主 服务 器 系统 管理 等 
职能 而 设立 的 非 赢利 机 构 。ICANN 为 不 同 的 国家 或 地 区 设置 了 相应 的 顶级 域名 ， 这 些 域名 通常 都 
由 两 个 英文 字母 组 成 。 例 如 ，.uk RERE, fr ARRAN, jp 代表 日 本 。 中 国 的 顶级 域名 是 .cn，.cn 
下 的 域名 由 中 国 互 联网 络 信息 中 心 (China Internet Network Information Center, CNNIC) 进行 管理 。 

域名 只 是 某 个 主机 的 别名 ， 并 不 是 真正 的 主机 地 址 ， 主 机 地 址 只 能 是 IP 地 址 ， 为 了 通过 域名 
来 访问 主机 ， 就 必须 实现 域名 和 IP 地 址 之 间 的 转换 。 这 个 转换 工作 就 由 域名 系统 (Domain Name 
System, DNS) 来 完成 。DNS 是 因特网 的 一 项 核心 服务 。 它 作为 可 以 将 域名 和 LP 地址 相互 映射 的 
一 个 分 布 式 数据 库 ， 能 够 使 人 更 方便 地 访问 互联 网 ， 而 不 用 记 住 能 够 被 机 器 直接 读 取 的 IP 数 串 。 
一 个 需要 域名 解析 的 用 户 先 将 该 解析 请 求 发 往 本 地 的 域名 服务 器 ， 如 果 本 地 的 域名 服务 器 能 够 解 
析 ， 则 直接 得 到 结果 ,否则 本 地 的 域名 服务 器 将 向 根 域名 服务 器 发 送 请 求 。 依 据 根 域名 服务 器 返回 
的 指针 再 查询 下 一 层 的 域名 服务 器 ， 以 此 类 推 ， 最 后 得 到 所 要 解析 域名 的 IP 地 址 。 


11.3.2 ”端口 的 概念 


我 们 知道 ， 网 络 上 的 主机 通过 IP 地 址 来 标识 自己 ,方便 其 他 主机 上 的 程序 和 自己 主机 上 
的 程序 建立 通信 。 但 主机 上 需要 通信 的 程序 有 很 多 , 那么 如 何 才 能 找到 对 方 主机 上 的 目的 程序 
M? P 地 址 只 是 用 来 寻找 目的 主机 的 ， 最 终 通信 还 需要 找到 目的 程序 。 为 此 ， 人 们 提出 了 端 
口 这 个 概念 ， 用 来 标识 目的 程序 。 有 了 端口 ， 一 台 拥有 IP 地 址 的 主机 可 以 提供 许多 服务 ， 比 
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如 Web 服务 进程 用 80 端口 提供 Web 服务 ，FTP 进程 通过 21 端口 提供 FTP 服务 ，SMTP 进程 
通过 23 端口 提供 SMTP 服务 ， 等 等 。 

如 果 把 IP 地 址 比 作 一 间 旅 馆 的 地 址 ， 端 口 就 是 这 家 旅馆 内 某 个 房间 的 房 号 。 旅 馆 的 地 址 
只 有 一 个 , 但 房间 却 有 很 多 个 ， 因 此 端口 也 有 很 多 个 。 端口 是 通 过 端口 号 来 标记 的 ,端口 号 是 
一 个 16 位 的 无 符号 整数 ， 范 围 是 0~65535 (2161)， 并 且 前 面 1024 个 端口 号 留 作 操作 系统 使 
用 ， 我 们 自己 的 应 用 程序 如 果 要 使 用 端口 ， 通 常用 1024 后 面 的 整数 作为 端口 号 。 














11.4 ”传输 层 


传输 层 为 应 用 层 提供 会 话 和 数据 报 通 信服 务 。 传 输 层 最 重要 的 两 个 协议 是 TCP HI UDP. 
TCP 协议 提供 一 对 一 的 、 面 向 连接 的 可 靠 通信 服务 ， 它 能 建立 连接 ， 对 发 送 的 数据 包 进 行 排 
序 和 确认 ， 并 恢复 在 传输 过 程 中 丢失 的 数据 包 。 与 TCP 不 同 ，UDP 协议 提供 一 对 一 或 一 对 多 
的 、 无 连接 的 不 可 靠 通信 服务 。 


11.4.1. TCP 协议 


TCP 协议 〈The Transmission Control Protocol， 传 输 控 制 协议 ) 是 面向 连接 的 、 保 证 高 可 靠 性 
(数据 无 丢失 、 数 据 无 失 序 、 数 据 无 错误 、 数 据 无 重复 到 达 ) 的 传输 层 协议 。TCP 协议 会 把 应 用 
层 数据 加 上 一 个 TCP k, H TCP 报 文 。TCP 报 文 首部 CTCP 头 ) 的 格式 如 图 11-6 所 示 。 


4 位 
首部 





图 11-6 
如 果 用 C 语言 来 定义 ， 可 以 这 样 写 : 
typedef struct TCP HEADER //TCP 头 定义 ， 共 20 个 字 节 
i 
short sSourPort; // 源 端口 号 16bit 
short sDestPort; // 目的 端口 号 16bit 
unsigned int uiSequNum; // 序列 号 32bit 
unsigned int uiAcknowledgeNum; // 确认 号 32bit 
s short sHeaderLenAndFlag; // 前 4 位 : TCP 头 长 度 , 中 6 位 : 保留 ， 后 6 位 : 标志 
p 
short sWindowSize; // 窗口 大 小 16bit 
short sCheckSum; // 检验 和 16bit 
short surgentPointer; // 紧急 数据 偏 移 量 16bit 


}TCP_HEADER, *PTCP HEADER; 
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11.4.2 UDP 协议 


UDP 协议 〈User Datagram Protocol， 用 户 数据 报 协议 ) 是 无 连接 的 、 不 保证 可 靠 的 传输 层 协 
议 。 它 的 协议 头 相对 比较 简单 ， 如 图 11-7 所 示 。 























图 11-7 
如 果 用 C 语言 来 定义 ， 可 以 这 样 写 : 
typedef struct UDP HEADER // UDP 头 定义 ， 共 8 个 字 节 
{ 
unsigned short m usSourPort; // 源 端口 号 16bit 
unsigned short m usDestPort; // 目的 端口 号 16bit 
unsigned short m usLength; // 数据 包 长 度 16bit 
unsigned short m usCheckSum; // 校 验 和 16bit 
}UDP_HEADER, *PUDP HEADER; 
11.5 WE 


网 络 层 向 上 层 提供 简单 灵活 的 、 无 连接 的 、 尽 最 大 努力 交付 的 数据 报 服务 。 该 层 重要 的 协议 
有 IP. ICMP (Internet 互联 网 控制 报 文 协议 ) 、IGMP (Intemet 组 织 管理 协议 ) 、ARP (地 址 转 
HHN) 、RARP《〈 反 向 地 址 转换 协议 ) 等。 


11.5.1 IP 协议 


IP (Internet Protocol， 网 际 协议 ) 是 TCP/IP 协议 簇 中 最 为 核心 的 协议 。 它 把 上 层 数据 报 封装 
成 卫 数据 包 后 进行 传输 。 如 果 IP 数据 包 太 大 ， 还 要 对 数据 包 进 行 分 片 后 再 传输 ， 到 了 目的 地 址 处 
再 进行 组 装 还 原 ， 以 适应 不 同 物理 网 络 对 一 次 所 能 传输 数据 大 小 的 要 求 。 


1. IP 协议 的 特点 
CD 不 可 靠 
不 可 靠 的 意思 是 它 不 能 保证 P 数据 包 能 成 功 地 到 达 目 的 地 。IP 协议 仅 提供 最 好 的 传输 服务 。 
如 果 发 生 某 种 错误 ， 如 某 个 路 由 器 暂时 用 完了 缓冲 区 ，IP 有 一 个 简单 的 错误 处 理 算法 : 丢弃 该 数 
据 报 , 然后 发 送 ICMP 消息 报 给 信 源 端 。 任何 要 求 的 可 靠 性 必须 由 上 层 协 议 来 提供 (如 TCP 协议 ) 。 


(2) 无 连接 

无 连接 的 意思 是 IP. 协议 并 不 维护 任何 关于 后 续 数据 报 的 状态 信息 。 每 个 数据 包 的 处 理 是 相互 
独立 的 。 这 也 说 明 ，IP 数据 报 可 以 不 按 发 送 顺序 接收 。 如 果 一 信 源 向 相同 的 信 宿 发 送 两 个 连续 的 
数据 报 〈 先 是 A， 然 后 是 B) ， 每 个 数据 报 都 是 独立 地 进行 路 由 选择 ， 可 能 选择 不 同 的 路 线 ， 因 此 
B 可 能 在 A 到 达 之 前 先 到 达 。 
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(3) 无 状态 

无 状态 的 意思 是 通信 双方 不 同步 传输 数据 的 状态 信息 ， 无 法 处 理 乱 序 和 重复 的 IP 数据 报 。IP 
数据 报 提供 了 标识 字段 用 来 唯一 标识 IP 数据 报 ， 处 理 IP 分 片 和 重组 ， 不 指示 接收 顺序 。 

2. IPv4 数据 包 的 包头 格式 

IP v4 数据 包 的 包头 格式 如 图 11-8 所 示 。 
































4 位 版 本 | Erd (Tos) 16 位 总 长 度 ( 字 节 数 ) 
16 位 标识 3 位 标志 | 138080886 
3 位 生存 时 间 ( TTL) | — 8 位 协议 16 位 首部 校 验 和 
32 位 源 Ip 地 址 
32 位 目的 Ip 地 址 
选项 (如 果 有 ) | 填充 
sa | 
H 11-8 


这 里 主要 介绍 IPv4 的 包头 结构 ，IPv6 的 结构 与 之 不 同 。 图 11-8 中 的 “数据 ”以 上 部 分 就 
是 卫 包 头 的 内 容 。 因 为 有 了 选项 部 分 ， 所 以 耳 包头 的 长 度 是 不 确定 的 。 如 果 选 项 部 分 没有 ， 
则 IP 包头 的 长 度 为 (4+4+8+16+16+3+13+8+8+16+32+32) bit-160bit-20 字 节 , 这 也 是 IP 包头 
的 最 小 长 度 。 

版 本 〈Version): 占用 4 比特， 标识 目前 采用 的 人 P 协议 的 版 本 号 , 一 般 的 值 为 0100 (表示 
IPv4), 0110 (表示 IPv6)。 

首部 长 度 : 即 IP 包头 长 度 (Header Length)， 这 个 字段 的 作用 是 为 了 描述 IP 包头 的 长 度 。 
该 字段 占用 4 比特 ， 由 于 在 IP 包头 中 有 变 长 的 可 选 部 分 ， 为 了 能 多 表示 一 些 长 度 ， 因 此 采 上 
4 字 节 (32 比特 ) 为 本 字段 数值 的 单位 ， 比 如 4 比特 最 大 能 表示 为 1111， 即 15， 单 位 是 4 字 
节 ， 因 此 最 多 能 表示 的 长 度 为 15X 4-760 字 节 。 

服务 类 型 (Type of Service; TOS): 占用 8 比特 , 这 8 位 可 用 PPPDTRCO 八 个 字符 来 表示 ， 
其 中 ，PPP 定义 了 包 的 优先 级 ， 取 值 越 大 表示 数据 越 重 要 ， 取 值 如 表 11-1 所 示 。 


表 11-1 PPP 定义 了 包 的 优先 级 


peram 














普通 (Routine) JKE (Flash Override) 


立即 (Immediate) 
WE (Flash) 


延迟 ，0 表示 普通 ，1 表示 延迟 尽量 小 。 
吞吐 量 ，0 表示 普通 ，1 表示 流量 尽量 大 。 

: 可 靠 性 ，0 表示 普通 ，1 表示 可 靠 性 尽量 大 。 
: 传输 成 本 ，0 表示 普通 ，1 表示 成 本 尽量 小 。 
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0: 这 是 最 后 一 位 ， 被 保留 ， 恒 定 为 0。 

总 长 度 : 占用 16 比特 空间 ， 该 字段 表示 以 字 节 为 单位 的 IP 包 的 总 长 度 (包括 全 包 

头 部 分 和 IP 数据 部 分 ) 。 如 果 该 字段 全 为 |， 就 是 最 大 长 度 ， 即 2'5.1- 65535 字 节 ~ 

63.9990234375K B. 有 些 书 上 写 最 大 是 64KB 其 实 是 达 不 到 的 最 大 长 度 只 能 是 65535 

字 节 ， 而 不 是 65536 FP. 

@ 标识 : 在 协议 栈 中 保持 着 一 个 计数 器 ， 每 产生 一 个 数据 报 ， 计 数 器 的 值 就 加 1， 并 将 
此 值 赋 给 标识 字段 。 注 意 这 个 “标识 符 ” 并 不 是 序号 ，IP 是 无 连接 服务 ， 数 据 报 不 
存在 按 序 接收 的 问题 当 IP 数据 报 由 于 长 度 超过 网 络 的 MTU( Maximum Transmission 
Unit， 最 大 传输 单元 ) 而 必须 分 片 (分 片 会 在 后 面 讲 到 ， 意 思 就 是 把 一 个 大 的 网 络 数 
据 包 拆 分 成 一 个 个 小 的 数据 包 ) 时 ， 这 个 标识 字段 的 值 就 被 复制 到 所 有 的 小 分 片 的 标 
识字 段 中 。 相同 的 标识 字段 的 值 使 得 分 片 后 各 数据 包 片 最 后 能 正确 地 重 装 成 为 原来 的 
大 数据 包 。 该 字段 占用 16 比特 。 

€ (Flags) 该 字段 占用 3 比特 该 字段 最 高 位 不 使 用 第 二 位 称 DF( Don't Fragment ) 
fi, DF 位 设 为 1 时 表明 路 由 器 不 用 对 该 上 层 数 据 包 分 片 。 如 果 一 个 上 层 数 据 包 无 法 
在 不 分 段 的 情况 下 进行 转发 ， 则 路 由 器 会 丢弃 该 上 层 数 据 包 并 返回 一 个 错误 信息 。 最 
低位 称 MF (More Fragments ) 位 ， 为 1 时 说 明 这 个 IP 数据 包 是 分 片 的 ， 并 且 后 续 还 
有 数据 包 ， 为 0 时 说 明 这 个 IP 数据 包 是 分 片 的 ， 但 已 经 是 最 后 一 个 分 片 了 。 

e KRR: 该 字段 的 含义 是 某 个 分 片 在 原 IP 数据 包 中 的 相对 位 置 。 第 一 个 分 片 的 偏 移 
量 为 0。 片 偏 移 以 8 字 节 为 偏 移 单位 。 这 样 ， 每 个 分 片 的 长 度 一 定 是 8 字 节 (64 位 ) 
的 整数 倍 。 该 字段 占 13 比特 。 

e 生存 时 间 ， 也 称 存活 时 间 (Time To Live, TTL): 表示 数据 包 到 达 目 标 地 址 之 前 的 
路 由 跳 数 。TTL 是 由 发 送 端 主机 设置 的 一 个 计数 器 ， 每 经 过 一 个 路 由 节点 就 减 1， 减 
到 为 0 时， 路 由 就 丢弃 该 数据 包 ， 向 源 端 发 送 ICMP 差错 报 文 。 这 个 字段 的 主要 作用 
是 防止 数据 包 不 断 在 IP 互联 网 络 上 永 不 终止 地 循环 转发 。 该 字段 占 8 比特 。 

€ HR: 该 字段 用 来 标识 数据 部 分 所 使 用 的 协议 ， 比 如 取 值 1 表示 ICMP、 取 值 2 表示 
IGMP, 取 值 6 表示 TCP, 取 值 17 表 示 UDP, 取 值 88 表示 IGRP. 取 值 89 表示 OSPF, 
该 字段 占 8 比特 。 

€ 首部 校 验 和 (Header Checksum) : 该 字段 用 于 对 IP 头 部 的 正确 性 进行 检测 ， 但 不 包 
含 数据 部 分 。 前 面 提 到 ， 每 个 路 由 器 会 改变 TTL 的 值 ， 所 以 路 由 器 会 为 每 个 通过 的 
数据 包 重 新 计算 首部 校 验 和 。 该 字段 占 16 比特 。 

e 起 源 和 目标 地 址 : 用 于 标识 这 个 IP 包 的 起 源 和 目标 卫 地址。 值得 注意 的 是 ， 除 非 
使 用 NAT ( 网络 地 址 转换 ) ， 否 则 整个 传输 的 过 程 中 ， 这 两 个 地 址 不 会 改变 。 这 两 
个 字段 都 占用 32 比特 。 

€ ”选项 (可 选 ) : 这 是 一 个 可 变 长 的 字段 。 该 字段 属于 可 选项 ， 主 要 是 在 一 些 特殊 情况 
下 使 用 。 最 大 长 度 是 40 字 节 。 

€ 填充 (Padding) : 由 于 IP 包头 长 度 (Header Length) 字段 的 单位 为 32bit， 因 此 IP 

包头 的 长 度 必须 为 32bit 的 整数 倍 。 在 可 选项 后 面 ， 耳 协议 会 填充 若干 个 0， 以 达到 
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32bit 的 整数 倍 。 
在 Linux 源 代码 中 ，IP 包头 的 定义 如 下 : 


struct iphdr { 
#if defined( LITTLE ENDIAN BITFIELD) 
u8 ihl:4, 
version:4; 
#elif defined ( BIG ENDIAN BITFIELD) 
u8 version:4, 
ihl:4; 
#else 
#error "Please fix <asm/byteorder.h>" 
#endif 
u8 tos; 
bel6 tot len; 
bel6 id; 
bel6 frag off; 
u8 ttl; 
u8 protocol; 
suml16 check; 
be32 saddr; 
be32 daddr; 
/*The options start here. */ 
H 


这 个 定义 可 以 在 源 代码 目录 的 include/uapi/linux/ip.h 中 查 到 。 
3. IP 数据 包 分 片 
IP. 协议 在 传输 数据 包 时 ， 将 数据 包 分 为 若干 分 片 〈 小 数据 包 ) 后 进行 传输 ， 并 在 目的 系 


统 中 进行 重组 。 这 一 过 程 称 为 分 片 〈fragmentation )。 





要 理解 IP 分 片 ， 首 先 要 理解 MTU (最 大 传输 单元 )， 物 理 网 络 一 次 传送 的 数据 是 有 最 大 


长 度 的 ， 因 此 网 络 层 下 层 (数据 链 路 层 ) 的 传输 单元 (数据 帧 ) 也 有 一 个 最 大 长 度 ， 这 个 最 大 
长 度 的 值 就 是 MTU, 每 一 种 物理 网 络 都 会 规定 链 路 层 数 据 帧 的 最 大 长 度 ， 比 如 以 太 网 的 MTU 
为 1500 字 节 。 


IP 协议 在 传输 数据 包 时 ， 若 IP 数据 包 加 上 数据 帧 头 部 后 长 度 大 于 MTU， 则 将 数据 包 切 





分 成 若干 分 片 〈 小 数据 包 ) 后 再 进行 传输 ， 并 在 目标 系统 中 进行 重组 。 耳 分 片 既 可 能 在 源 端 
主机 进行 ， 也 可 能 发 生 在 中 间 的 路 由 器 处 ， 因 为 不 同 网 络 的 MTU 是 不 一 样 的 ， 而 传输 的 整个 
过 程 可 能 会 经 过 不 同 的 物理 网 络 。 如 果 传 输 路 径 上 的 某 个 网 络 的 MTU 比 源 端 网 络 的 MTU 小 ， 








路 由 器 就 可 能 对 IP 数据 报 再 次 进行 分 片 。 分 片 数据 的 重组 只 会 发 生 在 目的 端的 耳 层 。 
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4. IP 地 址 的 定义 


IP 协议 中 有 个 概念 叫 IP 地 址 。 所 谓 IP 地 址 ， 就 是 Internet 中 主机 的 标识 ，Intemet 中 的 主机 要 
的 主机 通信 必须 具有 一 个 IP 地 址 。 就 像 房子 要 有 个 门牌 号 ， 这 样 邮递 员 才 能 根据 信封 上 的 家 


庭 地 址 送 到 目的 地 。 


IP 地 址 现在 有 两 个 版 本 ， 分 别 是 32 位 的 IPv4 和 128 位 的 IPv6， 后 者 是 为 了 解决 前 者 不 够 用 


而 产生 的 。 每 个 IP 数据 包 都 必须 携带 目的 IP 地 址 和 源 IP 地 址 ， 路 由 器 依靠 此 信息 为 数据 包 选 择 





路 由 。 
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这 里 以 IPv4 为 例 ，IP 地 址 是 由 4 个 数字 组 成 的 ， 数 字 之 间 用 小 圆 点 隔 开 ， 每 个 数字 的 取 值 范 
围 为 0~255 (包括 0 和 255) 。 通 常 有 两 种 表示 形式 : 


(1) 十 进 制 表示 ， 比 如 192.168.0.1。 

(2) 二 进 制 表示 ， 比 如 11000000.10101000.00000000.00000001 。 

两 种 方式 可 以 相互 转换 ， 每 8 位 二 进 制 数 对 应 1 位 十 进 制 数 。 如 图 11-9 所 示 是 一 个 例子 。 
1 1 


i EUER MAS rers TREE TuS 
le—8bi ts 一 | 


三 进 制 ”| 10101100 || 00010000 || 01100100 || 00000010 


点 分 十 进 制 172 





图 11-9 
实际 应 用 中 多 用 十 进 制 表示 ， 比 如 172.16.100.2。 


5. IP 地 址 的 两 级 分 类 编 址 

因特网 由 很 多 网 络 构成 ， 每 个 网 络 上 都 有 很 多 主机 ， 这 样 便 构成 了 一 个 有 层次 的 结构 。IP 地 
址 在 设计 的 时 候 就 考虑 到 地 址 分 配 的 层次 特点 ， 把 每 个 IP 地 址 分 割 成 网 络 号 〈NettD ) 和 主机 号 
(HostID) 两 部 分 ， 网络 号 表示 主机 属于 互联 网 中 的 哪 一 个 网 络 , 而 主机 号 则 表示 其 属于 该 网 络 中 
的 哪 一 台 主机 ， 两 者 之 间 是 主 从 关系 ， 同 一 网 络 中 绝对 不 能 有 主机 号 完全 相同 的 两 台 计 算 机 ， 和 否则 
会 报 出 IP 地 址 冲突 。IP 地 址 分 为 两 部 分 后 ，IP 数据 包 从 网 际 上 的 一 个 网 络 到 达 另 一 个 网 络 时 ， 选 
择 路 径 可 以 基于 网 络 而 不 是 主机 。 在 大 型 的 网 际 中 ,这 一 点 优势 特别 明显 ， 因 为 路 由 表 中 只 存储 网 
络 信息 而 不 是 主机 信息 ， 这 样 可 以 大 大 简化 路 由 表 ， 方便 路 由 器 的 IP 寻 址 。 

根据 网 络 地址 和 主机 地 址 在 TP 地 址 中 所 占 的 位 数 可 将 IP 地 址 分 为 A、B、C、D、E 五 类 , 每 
一 类 网 络 可 以 从 IP 地 址 的 第 一 个 数字 看 出 ， 如 图 11-10 所 示 。 

网 络 主机 





A 类 [ES Bm ESG 
0—126 221-2-16.777,214 


网 络 一 一 主机 
B 类 MTU onc) NENHNNEN EN 





128—191 216-2-65534 
Ck — HERES i NEHME 
192—223 28-2-254 
多 广播 
DZO MD ER ER ES 
224—239 
实验 室 保留 
rA ME BE ESEREEEH FE 
40—255 
E 11-10 


ME 
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ik 53S IP 地址 中 ，A 类 地 址 的 第 1 位 为 0， 第 2-8 位 为 网 络 地 址 ， 第 9-32 位 为 主机 地 址 ， 这 
类 地 址 适用 于 为 数 不 多 的 主机 数 大 于 2* 的 大 型 网 络 ，A 类 地 址 的 网 段 为 1~126 (27-2) 个 , 每 个 A 
类 网 络 最 多 可 以 容纳 16777214 (224-2) 台 主 机 。 

B 类 地 址 前 两 位 分 别 为 1 和 0， 第 3-16 位 为 网 络 地 址 ， 第 17-32 位 为 主机 地 址 ， 此 类 地 址 用 
于 主机 数 介 于 2540 25 之 间 的 中 型 网 络 ，B 类 网 络 可 以 有 16382 220. 个 网 段 。 

C 类 地 址 前 3 位 分 别 为 1、1、0， 第 4-24 位 为 网 络 地 址 ， 其 余 为 主机 地 址 ， 用 于 每 个 网 络 只 
能 容纳 254 Q*2) 台 主 机 的 大 量 小 型 网 ，C 类 网 络 数量 上 限 为 2097150 (2*1-2) 个 。 

D 类 地 址 前 4 位 为 1、1、1、0， 其 余 为 多 目地 址 。 

E 类 地 址 前 5 位 为 1、1、1、1、0， 其 余 位 数 留待 后 用 。 

A 类 IP 的 第 一 个 字 节 范围 是 0~126, B 类 IP 的 第 一 个 字 节 范围 是 128~191, C X P 的 第 一 个 
字 节 范围 是 192~223， 所 以 看 到 192.X.X.X 肯定 是 C 类 IP 地址 ， 大 家 根据 IP 地 址 的 第 一 个 字 节 的 
范围 就 能 够 推导 出 该 全 属于 A 类 还 是 B 类 或 C 类 。 

IP 地 址 以 A、B、C 两 类 为 主 ， 又 以 B、C 两 类 地 址 更 为 常见 。 除 此 之 外 ， 还 有 一 些 特殊 用 途 
的 IP 地 址 ， 如 广播 地 址 (主机 地 址 全 为 1， 用 于 广播 ， 这 里 的 广播 是 指 同时 向 网 上 所 有 主机 发 送 
报 文 ， 不 是 指 我 们 日 常 所 听 的 那 种 广播 ) 、 有 限 广播 地 址 (所 有 地 址 全 为 1， 用 于 本 网 广播 ) 、 本 
网 地 址 (网 络 地址 全 为 0， 后 面 的 主机 号 表示 本 网 地 址 ) 、 回 送 测试 地 址 (127.x.x.x 型 ， 用 于 网 络 
软件 测试 及 本 地 机 进程 间 通信 ) 、 主 机 位 全 0 地址 (这 种 地 址 的 网 络 地 址 就 是 本 网 地 址 ) 及 保留 地 
址 (网络 号 全 1 和 全 0 两 种 ) 。 由 此 可 见 ， 网 络 位 全 !1 或 全 0 和 主机 位 全 1 或 全 0 都 是 不 能 随意 分 
配 的 。 这 也 是 前 面 的 A、B、C 类 网 络 的 网 络 数 及 主机 数 要 减 2 的 原因 。 

总 之 ， 主 机 号 全 为 0 或 全 为 1 时 分 别 作为 本 网 络 地 址 和 广播 地 址 使 用 ， 这 种 IP 地 址 不 能 分 配 
给 用 户 使 用 。D 类 网 络 用 于 广播 , 它 可 以 将 信息 同时 传送 到 网 上 的 所 有 设备 ,而 不 是 点 对 点 的 信息 
传送 ， 这 种 网 络 可 以 用 来 召开 电视 电话 会 议 。E 类 网 络 常用 于 进行 试验 。 网 络 管理 员 在 配置 网 络 时 
不 应 该 采用 D 类 和 E 类 网 络 。 特 殊 的 IP 地 址 如 表 11-2 所 示 。 


表 11-2 ”特殊 的 IP 地 址 








表示 本 主机 ， 使 用 这 个 地 址 ， 应 用 程序 可 以 像 访 问 远程 主机 一 样 访 
问 本 主机 


网 络 号 全 为 0 ff] TP 地 址 表示 本 网 络 的 某 主 机 ， 如 0.0.0.88 将 访问 本 网 络 中 节点 为 88 的 主机 


主机 号 全 为 0 的 IP 地 址 表示 网 络 本 身 
网 络 号 或 主机 号 全 为 1 表示 所 有 主机 


255.255.255.255 表示 本 网 络 广播 








当前 ，A 类 地 址 已 经 全 部 分 配 完 ，B 类 也 不 多 了 ， 为 了 有 效 并 连续 地 利用 剩 下 的 C 类 地 址 ， 
互联 网 采用 CIDR (Classless Inter Domain Routing， 无 类 别 域 间 路 由 ) 方式 把 许多 C 类 地 址 合 起 来 
作为 B 类 地 址 分 配 ,整个 世界 被 分 为 4 个 地 区 ,每 个 地 区 分 配 一 段 连续 的 C 类 地 址 : 欧洲 (194.0.0.0 一 
195.255.255.255) 、 北 美 (198.0.0.0~199.255.255.255) 、 中 南美 (200.0.0.0 一 201.255.255.255) 、 
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亚太 地 区 (202.0.0.0—203.255.255.255) 、 保 留 备用 (204.0.0.0~223.255.255.255) 。 这 样 每 一 类 都 
有 约 3200 万 网 址 可 供 使 用 。 


6. 网 络 掩 码 

在 IP 地址 的 两 级 编 址 中 ，IP 地 址 由 网 络 号 和 主机 号 两 部 分 组 成 ， 如 果 我 们 把 主机 号 部 分 全 部 
置 零 ， 此 时 得 到 的 地 址 就 是 网 络 地 址 ， 网 络 地 址 可 以 用 于 确定 主机 所 在 的 网 络 ， 为 此 路 由 器 只 需 计 
算出 IP 地 址 中 的 网 络 地 址 ， 然 后 跟 路 由 表 中 存储 的 网 络 地 址 相 比 较 ， 就 可 以 知道 这 个 分 组 应 该 从 
哪个 接口 发 送出 去 。 当 分 组 达到 目的 网 络 后 ， 再 根据 主机 号 抵达 目的 主机 。 

要 计算 出 IP 地 址 中 的 网 络 地 址 ， 需 要 借助 于 网 络 掩 码 ， 或 称 默认 掩 码 。 这 是 一 个 32 位 的 数 ， 
左边 连续 n 位 全 部 为 1， 后边 32-n 位 连续 为 0。A、B、C 三 类 地 址 的 网 络 掩 码 分 别 为 255.0.0.0、 
255.255.0.0 和 255.255.255.0。 我 们 通过 IP 地 址 和 网 络 掩 码 进行 与 运算 ,得 到 的 结果 就 是 该 IP 地 址 
的 网 络 地 址 。 网络 地 址 相同 的 两 台 主 机 就 处 于 同一 个 网 络 中 , 它们 可 以 直接 通信 ,而 不 必 借 助 于 路 
由 器 。 

举 个 例子 ， 现 在 有 两 台 主机 A 和 B，A 的 IP 地 址 为 192.168.0.1， 网 络 掩 码 为 255.255.255.0; 
B 的 IP 地址 为 192.168.0.254， 网 络 掩 码 为 255.255.255.0。 我 们 先 运 行 A， 把 它 的 IP 地 址 和 子 网 掩 
码 每 位 相 与 。 





IP: 11010000.10101000.00000000.00000001 

子 网 掩 码 : 11111111.11111111.11111111.00000000 

AND 运算 

网 络 号 : 11000000.10101000.00000000.00000000 

转换 为 十 进 制 : 192.168.0.0 

FHE B 的 IP 地 址 和 子 网 掩 码 每 位 相 与 : 

IP: 11010000.10101000.00000000.11111110 

Ced: 11111111.11111111.11111111.00000000 

AND 运算 

网 络 号 : 11000000.10101000.00000000.00000000 

转换 为 十 进 制 : 192.168.0.0 

我 们 看 到 ，A 和 B 两 台 主 机 的 网 络 号 是 相同 的 ， 因 此 可 以 认为 它们 处 于 同一 网 络 。 

由 于 IP 地 址 越 来 越 不 够 用 ， 为 了 不 浪费 ， 人 们 对 每 类 网 络 进一步 划分 出 子 网 ， 为 此 地 址 的 
编 址 又 有 了 三 级 编 址 的 方法 ， 即 子 网 内 的 某 个 主机 IP 地 址 ={< 网 络 号 >,< 子 网 号 >,< 主 机 号 >}， 该 方 
法 中 有 了 子 网 掩 码 的 概念 。 后 来 又 提出 了 超 网 、 无 分 类 编 址 和 IPv6。 限 于 篇 幅 ， 这 里 不 再 叙述 。 





11.5.2. ARP 协议 


网 络 上 的 IP 数据 包 到 达 最 终 目 的 网 络 后 ， 必 须 通过 MAC 地 址 来 找到 最 终 目 的 主机 ， 而 数据 
包 中 只 有 IP 地 址 ， 为 此 需要 把 IP 地 址 转 为 MAC 地 址 ， 这 个 工作 就 由 ARP 协议 来 完成 。ARP 协 
议 是 网 际 层 中 的 协议 , 用 于 将 IP 地 址 解析 为 MAC 地 址 。 通常，ARP 协议 只 适用 于 局 域 网 中 。ARP 
协议 的 工作 过 程 如 下 : 
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(1) 本 地 主机 在 局 域 网 中 广播 ARP 请 求 ，ARP 请 求 数据 帧 中 包含 目的 主机 的 IP 地 址 。 这 一 
步 所 表达 的 意思 就 是 “如 果 你 是 这 个 IP 地 址 的 拥有 者 ， 请 回答 你 的 硬件 地 址 ”。 

(2) 目的 主机 收 到 这 个 广播 报 文 后 ， 用 ARP 协议 解析 这 份 报 文 ， 识 别 出 是 询问 其 硬件 地 址 。 
于 是 发 送 ARP 应 答 包 ， 里 面包 含 IP 地 址 及 其 对 应 的 硬件 地 址 。 

(3) 本 地 主机 收 到 ARP 应 答 后 ， 知 道 了 目的 地 址 的 硬件 地 址 ， 之 后 的 数据 报 就 可 以 传送 了 。 
同时 , 会 把 目的 主机 的 IP 地 址 和 MAC 地 址 保存 在 本 机 的 ARP RP, 以 后 通信 直接 查找 此 表 即 可 。 

我 们 在 Windows 操作 系统 的 命令 行 下 可 以 使 用 “arp -a” 命 令 来 查询 本 机 ARP 缓存 列表 ， 如 
图 11-11 所 示 。 








FH 


A 





[- 
Erg 管理 员 : L\windows\system32\cmd.exe 


92-47-e5-d6 
I -FEFE-FF 
90 98-88-16 
90 98-88-fc 
98 ff-fa 
£F-FF-FF-FF-FF 








图 11-11 
另外 ， 可 以 使 用 “arp -d” 命 令 清除 ARP ZER. 

ARP 协议 通过 发 送 和 接收 ARP 报 文 来 获取 物理 地 址 ，ARP 报 文 的 格式 如 图 11-12 所 示 。 
pest 地 址 长 度 


协议 地 址 长 度 
BES] | [ET] a Tas pa p 发 送 端 | 目的 以 太 网 | 目的 
目的 地 址 | 源 地 址 类 型 | 类 型 | 类 型 a | 人 太 网 地 址 | IP 地 址 地 址 JP 地 址 
2. 11 5 1 7 


6 6 6 
— ukmi — A 28 字 节 ARP 请 求 应 答 一 一 一 一 一 一 | 




































































ARP 为 0x0806/ 1.ARP 请 求 
2.ARP 应 答 
3.RARP 请 求 
以 太 网 4.RARP 应 答 
H 
Ox8000 表 示 IP 地 址 











图 11-12 
结构 ether header 定义 了 以 太 网 帧 首部 ; 结构 arphdr 定义 了 其 后 的 5 个 字段 ， 其 信息 用 于 在 任 
何 类 型 的 介质 上 传送 ARP 请 求 和 回答 ; ether_arp 结构 除了 包含 arphdr 结构 外 ， 还 包含 源 主机 和 目 
的 主机 的 地 址 。 如 果 这 个 报 文 格式 用 C 语言 表述 ， 可 以 这 样 写 : 





Linux C 与 C++ 一 线 开发 实践 





// 定 义 常量 

#define EPT IP 0x0800 /* type: IP */ 

#define EPT ARP  0x0806 /* type: ARP */ 

#define EPT RARP 0x8035 /* type: RARP */ 

#define ARP HARDWARE 0x0001 /* Dummy type for 802.3 frames */ 
#define ARP REQUEST 0x0001 /* ARP request */ 

#define ARP REPLY 0x0002 /* ARP reply */ 

// 定 义 以 太 网 首部 

typedef struct ehhdr 

t 

unsigned char eh dst[6]; /* destination ethernet addrress */ 
unsigned char eh src[6]; /* source ethernet addresss */ 
unsigned short eh type;  /* ethernet pachet type */ 

)EHHDR, *PEHHDR; 

// 定 义 以 太 网 arp 字 段 

typedef struct arphdr 

t 


//arp 首 部 
unsigned short arp hrd; /* format of hardware address */ 
unsigned short arp pro; /* format of protocol address */ 


unsigned char arp hln; /* length of hardware address */ 
unsigned char arp pln; /* length of protocol address */ 
unsigned short arp op; /* ARP/RARP operation */ 


unsigned char arp sha[6]; /* sender hardware address */ 
unsigned long arp spa; /* sender protocol address */ 
unsigned char arp tha[6]; /* target hardware address */ 
unsigned long arp tpa; /* target protocol address */ 
)ARPHDR, *PARPHDR; 


// 定 义 整个 arp 报 文 包 ， 总 长 度 42 字 节 
typedef struct arpPacket 

t 

EHHDR ehhdr; 

ARPHDR arphdr; 

) ARPPACKET, *PARPPACKET; 


11.5.3 RARP 协议 


RARP (Reverse Address Resolution Protocol， 逆 地 址 解析 协议 ) 允许 局 域 网 的 物理 机 器 从 网 关 
服务 器 的 ARP 表 或 者 缓存 上 请 求 其 IP 地 址 。 比如 局 域 网 中 有 一 台 主 机 只 知道 自己 的 物理 地 址 而 
不 知道 自己 的 IP 地 址 ， 那 么 可 以 通过 RARP 协议 发 出 征求 自身 IP 地 址 的 广播 请 求 ， 然 后 由 RARP 
服务 器 负责 回答 。RARP 协议 广泛 应 用 于 无 盘 工 作 站 引导 时 获取 IP 地 址 。RARP 允许 局 域 网 的 物 
理 机 器 从 网 管 服务 器 ARP 表 或 者 缓存 上 请 求 其 IP 地 址 。 

RARP 协议 的 工作 过 程 如 下 : 


(1) 主机 发 送 一 个 本 地 的 RARP 广播 ， 在 此 广播 包 中 ， 声 明 自 己 的 MAC 地 址 并 且 请 求 任何 
收 到 此 请 求 的 RARP 服务 器 分 配 一 个 IP 地 址 。 

(20 本 地 网 段 上 的 RARP 服务 器 收 到 此 请 求 后 ， 检 查 其 RARP 列表 ， 查 找 该 MAC 地 址 对 应 
ffo IP 地 址 。 
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G) WREE, RARP 服务 器 就 给 源 主 机 发 送 一 个 响应 数据 包 ， 并 将 此 IP 地 址 提供 给 对 方 主 
机 使 用 。 

(4) 如 果 不 存 在 ，RARP 服务 器 对 此 不 做 任何 响应 。 

C5) 源 主机 收 到 从 RARP 服务 器 的 响应 信息 ， 就 利用 得 到 的 IP 地 址 进行 通信 。 如 果 一 直 没 
有 收 到 RARP 服务 器 的 响应 信息 ， 表 示 初 始 化 失败 。 


RARP 的 帧 格式 与 ARP 协议 相同 ， 只 是 帧 类 型 字段 和 操作 类 型 不 同 。 


11.5.4 ICMP 协议 


ICMP (Internet Control Message Protocol, Internet 控制 报 文 协议 ) 是 网 络 层 的 一 个 协议 ， 用 于 
探测 网 络 是 否 连通 、 主 机 是 否 可 达 、 路 由 是 否 可 用 等 。 简 单 地 讲 ， 它 是 用 来 查询 诊断 网 络 的 。 
虽然 和 IP. 协议 同 处 网 络 层 ， 但 ICMP 报 文 却 是 作为 IP 数据 包 的 数据 ， 再 加 上 IP 包头 后 再 发 


送出 去 的 ， 如 图 11-13 所 示 。 


图 11-13 


IP 首部 的 长 度 为 20 字 节 。ICMP 报 文 作为 IP 数据 包 的 数据 部 分 ， 当 IP 首部 的 协议 字段 取 值 
为 1 时 ， 其 数据 部 分 是 ICMP 报 文 。ICMP 报 文 格式 如 图 11-14 所 示 。 
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该 行 4 个 字 节 的 内 容 由 ICMP 报 文 种 类 决定 
ICMP 的 数据 部 分 (长 度 由 ICMP 报 文 种 类 决定 ) 











首 部 数据 部 分 








IP 数据 报 
图 11-14 


其 中 , 最 上 面 的 (0 8 16 3D 指 的 是 比特 位 ， 所 以 前 3 个 字段 (类 型 、 代 码 、 校 验 和 ) 
一 共 占 了 32 比特 (类 型 占 8 位 ， 代 码 占 8 位， 检验 和 占 16 位 ) ， 即 4 字 节 。 所 有 ICMP 报 文 前 4 
个 字 节 的 格式 都 是 一 样 的 ， 即 任何 ICMP 报 文 都 含有 类 型 、 代 码 和 校 验 和 3 个 字段 ，8 位 类 型 和 8 
位 代码 字段 一 起 决定 了 ICMP 报 文 的 种 类 。 紧 接着 后 面 4 个 字 节 取决 于 ICMP 报 文 种 类 。 前 面 8 个 
字 节 就 是 ICMP 报 文 的 首部 ， 后 面 的 ICMP 数据 部 分 的 内 容 和 长 度 也 取决 于 ICMP 报 文 种 类 。16 
位 的 检验 和 字段 是 对 包括 选项 数据 在 内 的 整个 ICMP 数据 报 文 的 检验 和 ， 其 计算 方法 和 IP. 头 部 检 
验 和 的 计算 方法 是 一 样 的 。 

ICMP 报 文 可 分 为 两 大 类 : 差错 报告 报 文 和 查询 报 文 。 每 一 条 (或 称 每 一 种 ) ICMP 报 文 要 么 
属于 差错 报告 报 文 ， 要 么 属于 查询 报 文 ， 如 图 11-15 所 示 。 
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类 型 | 代码 描述 查询 | 差错 

0 0 回 显 应 答 (ping 应 答 ) * 

3 目的 不 可 达 
0 网 络 不 可 达 * 
1 主机 不 可 达 = 
2 协议 不 可 达 
3 端口 不 可 达 
4 需要 进行 分 片 但 设置 了 不 分 片 比特 
5 源 站 选 路 失败 i 
6 目的 网 络 不 认识 s 
7 目的 主机 不 认识 s 
8 源 主机 被 隔离 〈 作 上 废 不 用 ) 
9 目的 网 络 被 强制 禁止 z 
10 目的 主机 被 强制 禁止 * 
1 由 于 服务 类 型 TOS， 网 络 不 可 达 x 
12 由 于 服务 类 型 TOS， 主 机 不 可 达 bd 
13 由 于 过 滤 ， 通 信 被 强制 禁止 » 
14 主机 越权 " 
15 优先 权 中 止 生 效 ^ 

4 0 源 端 被 关闭 (基本 流 控制 ) id 

5 重 定向 
0 对 网 络 重 定向 
1 对 主机 重 定向 i 
2 对 服务 类 型 和 网 络 重 定向 Ld 
3 对 服务 类 型 和 主机 重 定向 x 

8 0 WREE (Ping 请 求 ) * 

9 0 路 由 器 通告 

10 0 路 由 器 请 求 id 

n 超时 
0 传输 期 间 生 存 期 间 为 0 * 
1 在 数据 报 组 装 期 间 生存 期 为 0 Ed 

12 参数 问题 
0 环 的 人 P 首 部 (包括 各 种 差错 ) * 
1 缺少 必需 的 选项 pe 

13 0 时 间 截 请 求 ai 

14 0 时 间 截 应 答 a 

15 0 信息 请 求 〈 作 废 不 用 ) * 

16 0 信息 应 答 〈 作 废 不 用 ) d 

17 0 地 址 掩 码 请 求 i 

1s [o 地 址 掩 码 应 答 z 

11-15 


从 图 11-15 中 可 以 看 出 ， 每 一 行 都 是 一 条 或 称 每 一 种 ) ICMP 报 文 ， 要 么 属于 查询 报 文 ， 要 
么 属于 差错 报告 报 文 。 
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1. ICMP 差错 报告 报 文 

我 们 从 图 11-15 中 可 以 发 现 属于 差错 报告 报 文 的 ICMP 报 文 很 多 , 为 了 归纳 方便 , 根据 其 类 型 
的 不 同 , 可 以 将 这 些 差错 报告 报 文 分 为 5 种 类 型 : 目的 不 可 达 (类 型 =3) 、 源 端 被 关闭 (类 型 =4) 、 
重 定向 (类 型 =5) 、 超 时 〈 类 型 =11 ) 和 参数 问题 〈 类 型 =12) 。 

从 图 11-15 中 可 以 看 到 ,代码 字段 不 同 的 取 值 进一步 表明 了 该 类 型 ICMP 报 文 的 具体 情况 ， 比 
如 类 型 为 3 的 ICMP 报 文 都 是 表明 目的 不 可 达 , 但 目的 不 可 达 是 什么 原因 呢 ? 此 时 就 用 代码 字段 进 
一 步 说 明 ， 比 如 代码 为 0 表示 网 络 不 可 达 ， 代 码 为 1 表示 主机 不 可 达 ， 等 等 。 

ICMP 协议 规定 ，ICMP 差错 报 文 必须 包括 产生 该 差错 报 文 的 源 数据 报 的 IP 首部 , 还 必须 包括 
EREIZ IP HIP) 首部 后 面 的 前 8 字 节 ， 这 样 ICMP 差错 报 文 的 IP 包 长 度 = 本 IP 首部 〈20 字 节 ) 
+ 本 ICMP 首部 〈8 字 节 ) + 源 卫 首部 O20 字 节 ) + 源 耳 包 的 耳 首 部 后 的 S 字 节 =56 字 节 。 我 们 
可 以 用 图 11-16 来 表示 ICMP 差错 报 文 。 


IP 数 据 报 的 数据 字段 





收 到 的 中 数据 报 





发 送 IP 数 据 报 (将 要 发 送 的 差错 IP 包 ) 



































2015 36585 
图 11-16 
我 们 来 看 一 个 具体 的 UDP 端口 不 可 达 的 差错 报 文 ， 如 图 11-17 所 示 。 
h iiS ac 一 一 一 一 | 
h= ) ICIP 报 文 =] 
K= RR => 
以 太 网 首部 | mas [ens [renna] UDP 首部 
14 字 节 20 字 节 8 字 节 20 字 节 8 字 节 
图 11-17 


从 图 11-17 可 以 看 到 IP 数据 报 的 长 度 是 56 FW. 为 了 让 大 家 更 形象 地 了 解 这 五 大 类 差错 报告 
报 文 的 格式 ， 我 们 用 图 形 来 表示 每 一 类 报 文 。 
(1) ICMP 目的 不 可 达 报 文 
目的 不 可 达 也 称 终点 不 可 达 ， 可 分 为 网 络 不 可 达 、 主 机 不 可 达 、 协 议 不 可 达 、 端 口 不 可 达 、 
需要 分 片 但 DF 比特 已 置 为 1 以 及 源 站 选 路 失败 等 16 种 报 文 ， 其 代码 字段 分 别 置 为 0-15。 当 出 现 
以 上 16 种 情况 时 ， 就 向 源 站 发 送 目的 不 可 达 报 文 。 目 的 不 可 达 报 文 的 报 文 格式 如 图 11-18 所 示 。 
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78 
类 型 (3) | 代码 (0--15) 校 验 和 | 
未 用 (必须 为 0) | 











?首部 (包括 选项 ) + 原始 I 数据 报 中 数据 的 前 3 字 节 











图 11-18 


(2) ICMP 源 端 被 关闭 报 文 
也 称 源 站 抑制 ， 当 路 由 器 或 主机 由 于 拥塞 而 丢弃 数据 报时 ， 就 向 源 站 发 送 源 站 抑制 报 文 ， 使 
源 站 知道 应 当 将 数据 报 的 发 送 速率 放 慢 。 该 类 报 文 的 格式 如 图 11-19 所 示 。 


0 T8 15 16 31 





类 型 (9 | 代码 (0) 校 验 和 
未 用 必须 为 0) 





IP 首部 (包括 选项 ) + 原始 IF 数据 报 中 数据 的 前 8 字 节 





图 11-19 


(3) ICMP 重 定向 报 文 

当 IP 数据 报应 该 被 发 送 到 另 一 个 路 由 器 时 ， 收 到 该 数据 报 的 当前 路 由 器 就 要 发 送 ICMP 重 定 
向 差错 报 文 给 IP 数据 报 的 发 送 端 。 重 定向 一 般 用 来 让 具有 很 少 选 路 信息 的 主机 逐渐 建立 更 完善 的 
路 由 表 。ICMP 重 定 向 报 文 只 能 由 路 由 器 产生 。 该 类 报 文 格式 如 图 11-20 所 示 。 





78 15 16 31 
(5) 类 型 | (0—3) e| 校 验 和 
应 该 使 用 的 路 由 器 TP 地址 











人 
Ed 
vy 








JI? 首部 (包括 选项 ) + 原始 IF 数据 报 中 数据 的 前 8 字 节 





图 11-20 
(4) ICMP 超时 报 文 
当 路 由 器 收 到 生存 时 间 为 零 的 数据 报时 ， 除 了 丢弃 该 数据 报 外 ， 还 要 向 源 站 发 送 时 间 超过 报 
文 。 当 目的 站 在 预先 规定 的 时 间 内 不 能 收 到 一 个 数据 报 的 全 部 数据 报 片 时 , 就 将 已 收 到 的 数据 报 片 
都 丢弃 ， 并 向 源 站 发 送 时 间 超 时 报 文 。 该 类 报 文 格式 如 图 11-21 所 示 。 
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T8 
类 型 (11) pem | 校 验 和 








未 用 (必须 为 0) 





ka de 
è 3t 


IP 首 部 《包括 选项 ) + 原始 TP 数据 报 中 数据 的 前 8 字 节 











图 11-21 
(5) ICMP 参数 问题 
当 路 由 器 或 目的 主机 收 到 的 数据 报 的 首部 中 的 字段 的 值 不 正确 时 ， 就 丢弃 该 数据 报 ， 并 向 源 
站 发 送 参 数 问 题 报 文 。 该 类 报 文 格式 如 图 11-22 所 示 。 








0 T8 15 16 31 
类 型 (12) | 代码 (0 或 1) 核验 和 
eT 
指针 未 用 (必须 为 0) n 
数据 报 报头 + 前 64 位 数据 3 











0 一 数据 报 某 个 参数 出 错 ， 指 针 域 指向 出 错 的 字 节 . 
1 一 数据 报 缺 少 某 个 选项 ， 无 指针 域 。 


图 11-22 


2. ICMP 查询 报 文 

根据 功能 的 不 同 ，ICMP 查询 报 文 可 以 分 为 四 大 类 : 请 求 回 显 〈Echo) RAE, RAER 
(Timestamp) 或 应 答 、 请 求 地 址 掩 码 〈Address mask) 或 应 答 、 请 求 路 由 器 或 通告 。 请 提起 精神 ， 
后 面 ping 编程 的 时 候 会 用 到 这 方面 的 理论 知识 。 前 面 提 到 ， 种 类 由 类 型 和 代码 字段 决定 ， 我 们 来 
看 一 下 它们 的 类 型 和 代码 ， 如 表 11-3 所 示 。 


表 11-3 ”类 型 和 代码 字段 含义 
[so  [o | 回 送 请 求 (TYPE=8) 、 应 答 (TYPE=0) 
[3 4 | | 时 间 惟 请 求 (TYPE=13) 、 应 答 (TYPE=14) 


[mg | || 地 址 掩 码 请 求 (TYPE=17) 、 应 答 CTYPE-18) 
[109 | | 路 由 器 请 求 (TYPE=10) 、 通 告 TYPE-9) 





这 里 要 提 一 下 回 送 请 求 和 应 答 ，Echo 的 中 文 翻译 为 回声 ， 有 的 文献 用 回 送 或 回 显 ， 本 书 用 回 
显 表示 。 请 求 回 显 的 含义 就 好 比 请 求 对 方 回复 一 个 应 答 。 我 们 知道 Linux 或 Windows 下 有 一 个 ping 
命令 ， 值 得 注意 的 是 ，Linux 下 的 ping 命令 产生 的 ICMP 报 文 大 小 是 56+8=64 FH (56 是 ICMP 
报 文 数据 部 分 长 度 , 8 是 ICMP 报头 部 分 长 度 ) , 而 Windows (比如 XP) 下 的 ping 命令 产生 的 ICMP 
报 文大 小 是 32+8=40 字 节 。 该 命令 就 是 本 机 向 一 个 目的 主机 发 送 一 个 请 求 回 显 〈 类 型 Type=8) 的 
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ICMP 报 文 ， 如 果 途 中 没有 异常 (例如 被 路 由 器 丢弃 、 目 标 不 回应 ICMP 或 传输 失败 ) ， 则 目标 返 
回 一 个 回 显 应 答 的 ICMP 报 文 〈 类 型 Type=0) ， 表 明 这 人 台 主 机 存在 。 后 面 章节 还 会 讲 到 ping 命令 
的 抓 包 和 编程 。 

为 了 让 大 家 更 形象 地 了 解 这 4 类 查询 报 文 格式 ， 我 们 用 图 形 来 表示 每 一 类 报 文 。 


(1) ICMP 请 求 回 显 和 应 答 回 显 报 文 格式 ， 如 图 11-23 所 示 。 
































0 78 15 16 31 
au costal 代码 (0) 核验 和 | i. 
标识 符 序号 4 
选项 数据 
图 11-23 
(2) ICMP 时 间 戳 请求 和 应 答 报 文 ， 如 图 11-24 所 示 。 
0 78 15 16 31 
类 型 " 
ass) | 代码 (0) 核验 和 E 
标识 符 序列 号 g 
RENIER 
rit ie 
TERR 
图 11-24 


(3) ICMP 地 址 掩 码 请 求 和 应 答 报 文 ， 如 图 11-25 所 示 。 


0 T8 15 16 31 


类 型 
(17 或 18) | 代码 (0) 
标识 符 




















32 位 子 网 掩 码 | 





图 11-25 


(4) ICMP 路 由 器 请 求 报 文 格式 和 通告 报 文 ， 如 图 11-26 和 图 11-27 所 示 。 
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路 由 器 地 址 [1] 


优先 级 [1] 


路 由 器 地 址 [2] 


优先 级 [2] 





图 11-27 


【 例 11.1】 抓 包 查 看 来 自 Windows 的 ping 包 


VMnet8 上 。 





CD 启动 VMware 下 的 XP， 设 置 网 络 连接 方式 为 NAT， 则 虚拟 机 XP 会 连接 到 虚拟 交换 机 


(2) 在 Windows 7 上 安装 并 打开 抓 包 软件 Wireshark， 选 择 要 捕获 网 络 数据 包 的 网 卡 是 


“VMware Virtual Ethernet Adapter for VMnet8”， 如 图 11-28 所 示 。 





11-28 
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双击 图 11-28 中 选中 的 网 卡 ,开始 在 该 网 卡 上 捕获 数据 .此 时 我 们 在 虚拟 机 XP(192.168.80.129) 
下 ping 宿主 机 (192.168.80.1) ， 可 以 在 Wireshark 下 看 到 捕获 到 的 ping 包 ， 如 图 11-29 所 示 的 是 
回 显 请 求 ， 我 们 可 以 看 到 ICMP 报 文 的 数据 部 分 是 32 字 节 ， 如 果 加 上 ICMP 报头 (8 FH), W 
是 40 字 节 。 





11-29 
再 看 一 下 回 显 应 答 ，ICMP 报 文 的 数据 部 分 长 度 依然 是 32 字 节 ， 如 图 11-30 所 示 。 





图 11-30 


【 例 11.2】 抓 包 查 看 来 自 Linux 的 ping 包 


(1) 启动 Vmware 下 的 Linux， 设 置 网 络 连接 方式 为 NAT， 则 虚拟 机 Linux 会 连接 到 虚拟 交 
换 机 VMnet8 上 。 
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(2) 在 Windows 7 上 安装 并 打开 抓 包 软件 Wireshark， 选 择 要 捕获 网 络 数据 包 的 网 卡 是 
“VMware Virtual Ethernet Adapter for VMnet8”， 图 示 可 以 参考 上 例 。 








我 们 在 虚拟 机 Linux (192.168.80.128) 下 ping 宿主 机 (192.168.80.1)， 可 以 在 Wireshark 下 看 
到 捕获 到 的 ping 包 ， 如 图 11-31 所 示 的 是 回 显 请 求 ， 我 们 可 以 看 到 ICMP 报 文 的 数据 部 分 是 56 F 
如 果 加 上 ICMP 报头 (8 字 节 ) ， 就 是 64 字 节 。 











E k Adapter Vaetd lox 
XEO WO) MAV MEO AR C) PAN AAM IAT) ABO 









































acol $ zla aT 
Uma EXT s e 
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I Internet Protocol Version 4, Sre: 192.168 B0128, Ort! 192.168.80.1 
È Internet Control Message Protocol 

(Echo (ping) request) 


Checksum: Bw4f27 [correct] 
[Checksum Status: Good] 
Identifier (BE): 34943 (0x887f) 
Identifier (LE): 32548 (0x788) 
Sequence number (BE): 5 《8x8965) 

| Sequence number (LE): 1280 (0x0500) 
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图 11-31 
再 看 一 下 回 显 应 答 ，ICMP 报 文 的 数据 部 分 长 度 依然 是 56 字 节 ， 如 图 11-32 所 示 。 
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SFrhernst TI, Src: Vmware ca (90:56:55: 
^f Internet Protocol Version 4, Sre: 192.168.80. 
= Internet Control Message Protocol 

Type: @ (Echo (ping) reply) 

Code: @ 


| Checksum: Oxc225 [correct] 

o [Checksum Status; Good] 
Identifier (BE): 36613 (Gx8f05) 
Identifier (LE): 1423 (9x658f) 

| Sequence number (BE): 3 (Gx0903) 
Sequence nunber (LE): 768 (9x9309) 





X 
Dst: 192.168.80.128 





[Response time: 0.105 ms] 
5 Data (56 bytes) 
Data: 8eBabo593000000029120290002000001011121314151617. .. 
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11.0 ”数据 链 路 层 


11.6.1. 数据 链 路 层 的 基本 概念 


数据 链 路 层 最 基本 的 服务 是 将 源 计 算 机 网 络 层 来 的 数据 可 靠 地 传输 到 相 邻 节点 目标 计算 机 的 
网 络 层 。 为 达到 这 一 目的 ， 数 据 链 路 层 主 要 解决 以 下 3 个 问题 : 


(1) 如 何 将 数据 组 合成 数据 块 〈 在 数据 链 路 层 中 ， 将 这 种 数据 块 称 为 帧 ， 帧 是 数据 链 路 层 的 
传送 单位 ) 。 

(20 如 何 控制 帧 在 物理 信道 上 的 传输 ， 包 括 如 何 处 理 传输 差错 、 如 何 调节 发 送 速率 以 使 之 与 
接收 方 相 匹配 。 

(3) 在 两 个 网 路 实体 之 间 提 供 数据 链 路 通路 的 建立 、 维 持 和 释放 管理 。 


11.6.2 ”数据 链 路 层 的 主要 功能 
数据 链 路 层 的 主要 功能 如 下 : 
COD 为 网 络 层 提供 服务 


€ 无 确定 的 无 连接 服务 。 适 用 于 实时 通信 或 者 误 码 率 较 低 的 通信 信道 ， 如 以 太 网 。 
@ 有 确定 的 无 连接 服务 。 适 用 于 误 码 率 较 高 的 通信 信道 ， 如 无 线 通信 . 
€ 有 确定 的 面向 连接 服务 。 适 用 于 通信 要 求 比较 高 的 场合 。 


(2) 成 帧 、 帧 定 界 、 帧 同步 、 透 明 传输 的 功能 
为 了 向 网 络 层 提 供 服务 ， 数 据 链 路 层 必 须 使 用 物理 层 提供 的 服务 。 而 物理 层 我 们 知道 ， 它 是 
以 比特 流 进行 传输 的 ,这 种 比特 流 并 不 保证 在 数据 传输 过 程 中 没有 错误 ,接收 到 的 位 数量 可 能 少 于 、 
等 于 或 者 多 于 发 送 的 位 数量 。 而 且 它们 还 可 能 有 不 同 的 值 ， 这 时 数据 链 路 层 为 了 实现 数据 有 效 的 差 
错 控 制 , 就 采用 一 种 “ 帧 ”的 数据 块 进行 传输 。 而 要 采用 帧 格式 传输 , 就 必须 有 相应 的 帧 同步 技术 ， 
LE BERE RU "UU (也 称 为 “ 帧 同步 ”) 功 能 。 
e 成 帧 :两 个 工作 站 之 间 传 输 信息 时 ， 必 须 将 网 络 层 的 分 组 封装 成 帧 ， 以 帧 的 形式 进行 传 
输 ， 将 一 段 数据 的 前 后 分 别 添加 首部 和 尾部 ， 就 构成 了 帧 。 
e WER: 首部 和 尾部 中 含有 很 多 控制 信息 ， 它 们 的 一 个 重要 作用 是 确定 帧 的 界限 ， 即 帧 
定 界 。 
e WEP: 帧 同步 指 的 是 接收 方 应当 能 从 接收 的 二 进 制 比特 流 中 区 分 出 帧 的 起 始 和 终止 。 
e 透明 传输 : 透明 传输 就 是 无 论 所 传 的 数据 是 什么 样 的 比特 组 合 都 能 在 链 路 上 传输 。 





G) 差错 控制 功能 

在 数据 通信 过 程 中 ， 难 免 会 因为 物理 链 路 性 能 和 网 络 通信 环境 等 因素 出 现 一 些 传送 错误 ， 但 
为 了 确保 数据 通信 的 准确 , 必须 使 得 这 些 错 误 发 生 的 概率 尽 可 能 低 。 这 一 功能 也 是 在 数据 链 路 层 实 
现 的 ， 就 是 它 的 “差错 控制 ”功能 。 
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(4) 流量 控制 

在 双方 的 数据 通信 中 ， 控 制 数据 通信 的 流量 同样 非常 重要 。 它 既 可 以 确保 数据 通信 的 有 序 进 
行 ,还 可 以 避免 通信 过 程 中 出 现 因为 接收 方 来 不 及 接收 而 造成 的 数据 丢失 。 这 就 是 数据 链 路 层 的 “ 流 
量 控制 ”功能 。 


(5) 链 路 管理 

数据 链 路 层 的 “ 链 路 管理 ”功能 包括 数据 链 路 的 建立 、 链 路 的 维持 和 释放 3 个 主要 方面 。 当 
网 络 中 的 两 个 节点 要 进行 通信 时 , 数据 的 发 送 方 必须 确定 接收 方 是 否 已 处 于 准备 接收 的 状态 。 为 此 
通信 双方 必须 先 要 交换 一 些 必要 的 信息 ， 以 建立 一 条 基本 的 数据 链 路 。 在 传输 数据 时 要 维持 数据 链 
路 ， 而 在 通信 完毕 时 要 释放 数据 链 路 。 


(6) MAC 寻 址 

这 是 数据 链 路 层 中 MAC 子 层 的 主要 功能 。 这 里 所 说 的 “ 寻 址 ”与 “IP 地 址 寻 址 ”是 完全 不 一 
样 的 ， 因 为 此 处 所 寻找 的 地 址 是 计算 机 网 卡 的 MAC 地 址 ， 也 称 “ 物 理 地 址 ” “硬件 地 址 ”， 而 不 
是 IP 地 址 。 在 以太 网 中 ， 采用 媒体 访问 控制 (Media Access Control, MAC) 地 址 进行 寻 址 ，MAC 
地 址 被 烧 入 每 个 以 太 网 网 卡 中 。 

网 络 接口 层 中 的 数据 通常 称 为 MAC 帧 ， 帧 所 用 的 地 址 为 媒体 设备 地 址 ， 即 MAC 地 址 ， 也 就 
是 通常 所 说 的 物理 地 址 。 每 一 块 网 卡 都 有 一 个 全 世界 唯一 的 物理 地 址 ， 它 的 长 度 固 定 为 6 字 节 ， 比 
如 00-30-C8-01-08-39。 我 们 在 Linux 操作 系统 的 命令 行 下 用 ifconfig -a 可 以 看 到 系统 所 有 网 卡 信息 。 

MAC 帧 的 帧 头 定义 如 下 : 


typedef struct MAC FRAME HEADER // 数 据 帧 头 定义 
{ 





char cDstMacAddress[6]; // 目 的 MAC 地 址 
char cSrcMacAddress[6]; // 源 MAC 地 址 
short m cType; // 上 一 层 协议 类 型 ， 如 0x0800 代 表 上 一 层 是 IP 协 议 ，0x080 6 为 


ARP 
)MAC FRAME HEADER, *PMAC FRAME HEADER; 
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从 本 章 开 始 讲述 具体 的 网 络 编程 。 本 书 讲述 的 Linux 网 络 编程 是 指 用 户 态 网 络 编程 ，Linux 网 
络 编程 还 包括 内 核 态 网 络 编程 。 顾 名 思 义 ,用 户 态 网 络 编程 开发 的 程序 都 是 在 用 户 态 运 行 的 ， 内 核 
态 网 络 编程 开发 的 程序 都 是 在 内 核 态 运行 的 。 实际 上 , 内 核 态 网 络 编程 和 用 户 态 网 络 编程 的 概念 类 
似 。 一 般 掌握 了 用 户 态 网 络 编程 后 ， 内 核 态 基本 上 就 是 替换 一 下 函数 形式 。 

Linux 用 户 态 网 络 编程 主要 基于 套 接 字 API， 套 接 字 API 是 Linux 提供 的 一 种 网 络 编程 接口 。 
通过 套 接 字 API, 开发 人 员 既 可 以 在 传输 层 上 进行 网 络 编程 , 也 可 以 跨越 传输 层 直 接 对 网 络 层 进行 
开发 。 套 接 字 API 已 经 是 用 户 态 网 络 编程 必须 要 掌握 的 内 容 。 套 接 字 编程 可 以 分 为 TCP 套 接 字 编 
程 、UDP 套 接 字 编程 和 原始 套 接 字 编程 ， 我 们 将 在 后 面 的 章节 分 别 叙述 。 

Socket 的 中 文 称呼 为 套 接 字 或 套 接 口 ， 是 TCP/IP 网 络 编程 中 的 基本 操作 单元 ， 可 以 看 作 不 同 
主机 进程 之 间 相互 通信 的 端点 。 套 接 字 是 应 用 层 与 TCP/IP 协议 簇 通信 的 中 间 软 件 抽象 层 ， 一 组 接 
口 把 复杂 的 TCP/IP 协议 簇 隐藏 在 套 接 字 接口 后 面 。 某 个 主机 上 的 某 个 进程 通过 该 进程 中 定义 的 套 
接 字 可 以 与 其 他 主机 上 同样 定义 了 套 接 字 的 进程 建立 通信 ， 传 输 数据 。 

Socket 起 源 于 UNIX, Æ UNIX 一 切 皆 文件 的 哲学 思想 下 ，Socket 是 一 种 “打开 一 读 / 写 一 关 
闭 ” 模 式 的 实现 ， 服 务 器 和 客户 端 各 自 维护 一 个 “文件 ”， 在 建立 连接 后 ， 可 以 向 自己 的 文件 写 入 
内 容 供 对 方 读 取 或 者 读 取 对 方 的 内 容 , 通信 结束 时 关闭 文件 。 当 然 这 只 是 一 个 大 体 路 线 , 实际 上 编 
程 还 有 不 少 细节 需要 考虑 。 

无 论 在 Windows 平台 还 是 Linux 平台 ， 都 对 套 接 字 实现 了 自己 的 一 套 编程 接口 。Windows 下 
的 Socket 实现 叫 Windows Socket. Linux 下 的 实现 有 两 套 :一 套 是 伯克利 套 接口 (Berkeley Sockets), 
起 源 于 Berkeley UNIX， 这 套 接口 很 简单 ， 得 到 了 广泛 应 用 ， 已 经 成 为 Linux 网 络 编程 事实 上 的 标 
WE; 另 一 套 是 传输 层 接口 (Transport Layer Interface; TLI)， 它 是 System V 系统 上 的 网 络 编程 API 
所 以 这 套 编程 接口 更 多 的 是 在 UNIX 上 使 用 。 

简单 地 介绍 一 下 System V 和 BSD C Berkeley Software Distribution), System V 的 鼻祖 正 是 1969 
年 AT&T 开发 的 UNIX， 随 着 1993 4E Novell 收购 AT&T 后 开放 了 UNIX 的 商标 ，System V 的 风 
格 也 逐渐 成 为 UNIX 厂商 的 标准 ,BSD 的 鼻祖 是 加 州 大 学 伯克利 分 校 在 1975 年 开发 的 BSD UNIX, 
后 来 被 开源 组 织 发 展 为 现在 众多 的 BSD 操作 系统 。 这 里 需要 说 明 的 是 ，Linux 不 能 称 为 “标准 的 
Unix” 而 只 能 称 为 “UNIX Like” 的 原因 有 一 部 分 就 来 自 它 的 操作 风格 介 于 两 者 之 间 (System V 和 
BSD) ， 而 且 不 同 的 厂商 为 了 照顾 不 同 的 用 户 ， 各 个 Linux 发 行 版 本 的 操作 风格 也 有 不 小 的 出 入 。 
本 书 讲述 的 Linux 网 络 编程 都 是 基于 Berkeley Sockets API 的 。 

Socket 是 在 应 用 层 和 传输 层 之 间 的 一 个 抽象 层 ， 它 把 TCP/IP 层 复杂 的 操作 抽象 为 几 个 简单 的 
接口 供应 用 层 调 用 已 实现 的 进程 在 网 络 中 通信 。Socket 在 TCP/IP 中 的 地 位 如 图 12-1 所 示 。 





套 接 字 基础 *102* 




























































































图 12-1 
由 图 12-1 可 以 看 出 ，Socket 编程 接口 其 实 就 是 用 户 进 程 (应 用 层 ) 和 传输 层 之 间 的 编程 接口 。 


12.1 网 络 程序 的 架构 


网 络 程序 通常 有 两 种 架构 ， 一 种 是 B/S 架构 (BrowserServer， 浏 览 器 /服务 器 ) ， 比 如 我 们 使 
用 火狐 浏览 器 浏览 Web 网 站 ， 火 狐 浏 览 器 就 是 一 个 Browser， 网 站 上 运行 的 Web 服务 器 就 是 一 个 
Server。 这 种 架构 的 优点 是 用 户 只 需要 在 自己 计算 机 上 安装 一 个 网 页 浏览 器 就 可 以 了 ， 主 要 工作 届 
辑 都 在 服务 器 上 完成 , 减轻 了 用 户 端的 升级 和 维护 的 工作 量 。 另 一 种 架构 是 C/S 架构 (Client/Server， 
客户 机 /服务 器 ) ， 这 种 架构 要 在 服务 器 端 和 客户 机 端 分 别 安装 不 同 的 软件 ， 并 且 对 于 不 同 的 应 用 ， 
客户 机 端 也 要 安装 不 同 的 客户 机 软件 , 有 时 候 客户 机 端的 软件 安装 或 升级 比较 复杂 , 因此 维护 起 来 
成 本 较 高 。 这 种 架构 的 优点 是 可 以 较 充 分 地 利用 两 端的 硬件 能 力 ,较为 合理 地 分 配 任务 。 值 得 注意 
的 是 ， 客 户 机 和 服务 器 实际 上 是 指 两 个 不 同 的 进程 ,服务器 是 提供 服务 的 进程 ,客户 机 是 请 求 服务 
和 接收 服务 的 进程 ， 它 们 通常 位 于 不 同 的 主机 上 《也 可 以 是 同一 主机 上 的 两 个 进程 ) ， 这 些 主机 有 
网 络 连接 ， 服 务 器 端 提供 服务 并 对 来 自 客户 端 进程 的 请 求 做 出 响应 。 比 如 我 们 计算 机 上 安装 的 QQ 
程序 就 是 一 个 客户 端 ， 而 在 腾讯 公司 内 部 还 有 服务 端 程序 。 

基于 套 接 字 的 网 络 编程 中 ， 通 常 使 用 C/S 架构 。 一 个 简单 的 客户 机 和 服务 器 之 间 的 通信 过 程 
如 下 : 


(1) 客户 机 向 服务 器 提出 一 个 请 求 。 
(2) 服务 器 收 到 客户 机 的 请 求 ， 进 行 分 析 处 理 。 
(3) 服务 器 将 处 理 的 结果 返回 给 客户 机 。 
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通常 ,一 个 服务 器 可 以 向 多 个 客户 机 提供 服务 。 因 此 对 服务 器 来 说 ,还 需要 考虑 如 何 有 效 地 处 
理 多 个 客户 的 请 求 。 


12.2” 套 接 字 的 类 型 


在 Linux 系统 下 ， 有 以 下 3 种 类 型 的 套 接 字 。 


(1) 流 套 接 字 (SOCK_STREAM) 

流 套 接 字 用 于 提供 面向 连接 的 、 可 靠 的 数据 传输 服务 。 该 服务 将 保证 数据 能 够 实现 无 差错 、 
无 重复 发 送 ， 并 按 顺 序 接收 。 流 套 接 字 之 所 以 能 够 实现 可 靠 的 数据 服务 ， 原 因 在 于 其 使 用 了 传输 控 
制 协议 ， 即 TCP 协议 。 


(2) 数据 报 套 接 字 (SOCK_DGRAM) 

数据 报 套 接 字 提供 了 一 种 无 连接 的 服务 。 该 服务 并 不 能 保证 数据 传输 的 可 靠 性 ， 数 据 有 可 能 
在 传输 过 程 中 丢失 或 出 现 重复 ， 且 无 法 保证 按 顺 序 接收 到 数据 。 数 据 报 套 接 字 使 用 UDP 协议 进行 
数据 的 传输 。 由 于 数据 报 套 接 字 不 能 保证 数据 传输 的 可 靠 性 ， 对 于 有 可 能 出 现 数据 丢失 的 情况 ， 需 
要 在 程序 中 做 相应 的 处 理 。 


(3) 原始 套 接 字 (SOCK RAW) 

原始 套 接 字 人 允许 对 较 低 层次 的 协议 直接 访问 ， 比 如 IP, ICMP 协议 ， 常 用 于 检验 新 的 协议 实 
现 ,或 者 访问 现 有 服务 中 配置 的 新 设备 , 因为 RAW SOCKET 可 以 自如 地 控制 Linux 下 的 多 种 协议 ， 
能 够 对 网 络 底层 的 传输 机 制 进行 控制 ,所 以 可 以 应 用 原始 套 接 字 来 操纵 网 络 层 和 传输 层 应 用 。 比 如 ， 
我 们 可 以 通过 RAW SOCKET 来 接收 发 向 本 机 的 ICMP, IGMP 协议 包 , 或 者 接收 TCP/IP 栈 不 能 够 
处 理 的 他 包 ,也 可 以 用 来 发 送 一 些 自 定 包头 或 自 定 协 议 的 IP 包 。 网络 监听 技术 经 常会 用 到 原始 套 

原始 套 接 字 与 标准 套 接 字 (标准 套 接 字 包 括 流 套 接 字 和 数据 报 套 接 字 〉 的 区 别 在 于 ， 原始 套 
接 字 可 以 读 写 内 核 没 有 处 理 的 IP 数据 包 ， 而 流 套 接 字 只 能 读 取 TCP 协议 的 数据 ， 数 据 报 套 接 字 只 
能 读 取 UDP 协议 的 数据 。 


12.3” 套 接 字 的 地 址 结构 


不 同 协 议 簇 的 套 接 字 地 址 的 定义 是 不 同 的 ， 如 AF_INET 的 地 址 为 struct socketaddr_in, 而 域 套 
接 字 协议 徐 AF. UNIX 的 地 址 为 struct socketaddr_un。 不 同 地 址 结构 的 定义 不 同 ， 占 用 的 内 存 大 小 
自然 不 同 。 

在 进行 套 接 字 编程 的 时 候 ， 很 多 套 接 字 函 数 都 需要 一 个 指向 套 接 字 地 址 结构 的 指针 作为 参数 。 
这 些 结构 的 名 字 均 以 sockaddr 开头 ， 比 如 ，IPv4 的 套 接 字 地 址 结构 体 为 sockaddr in, IPv6 的 套 接 
字 地 址 结构 体 为 sockaddr in6. 

IPv4 的 套 接 字 地 址 结构 体 sockaddr in 定义 在 <netineyin.h> 里 〈 这 个 头 文件 的 全 路 径 是 





"478。 
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/usr/include/ netinetin.h) ， 其 结构 体 定义 如 下 : 


/* Structure describing an Internet socket address. */ 

struct sockaddr in 

t 
SOCKADDR COMMON (sin ); / BV 
in port t sin port; /* Port number. 端口 号 */ 
struct in addr sin addr; /* Internet address. IP 地 址 */ 


/* Pad to size of "struct sockaddr'. 用 于 填充 的 0 字 节 */ 
unsigned char sin zero[sizeof (struct sockaddr) - 
SOCKADDR COMMON SIZE - 
sizeof (in port t) - 
sizeof (struct in addr)]; 
un 


HP, | SOCKADDR COMMON 是 一 个 宏 ， 定义 在 /usr/include/bits/sockaddr.h 中 ， 定 义 如 下 : 


#define SOCKADDR COMMON (sa prefix) \ 

sa family t sa prefix##family 

熟悉 C 语言 的 朋友 都 知道 ^\” 是 一 个 续 行 符 ， 表 示 两 行内 容 依旧 当 一 行 处 理 。 而 精通 C 语言 
的 朋友 知道 “ 磁 ” 用 来 连接 前 后 两 个 参数 ， 比 如 定义 了 一 个 宏 : #define SIGN( x ) INT. x, Jl int 
SIGN( 1 ); 展 开 后 变 为 int INT_1;。 这 里 顺便 讲 一 点 题 外 知识 ，C 语言 还 可 以 用 一 个 # 把 一 个 符号 直 
接 转 换 为 字符 串 ， 例 如 : 

#define STRING (x) 4x 

const char *str = STRING( test string ); 

str 的 内 容 就 是 test_string， 也 就 是 说 # 会 把 其 后 的 符号 直接 加 上 双 引 号 ， 这 些 都 是 我 们 编程 不 
大 用 到 的 知识 ， 但 Linux 头 文件 以 及 内 核 代码 中 却 经 常用 到 ， 不 得 不 熟悉 。 

言 归 正 传 ， 现 在 知道 了 _SOCKADDR COMMON(sa_prefix) 相当 于 sa family t 
sa_prefix##family， 并 且 sa prefix 是 一 个 宏 参 数 。 而 sa family t fE/usr/include/bits/sockaddr.h 中 的 
定义 如 下 : 

/* POSIX.1g specifies this type name for the ‘sa family' member. */ 

typedef unsigned short int sa family t; 

原来 就 是 一 个 无 符号 短 整 型 (unsigned short int) ， 有 人 可 能 会 问 ，short int 是 什么 ? HX short 
int 就 是 int， 是 int 的 正规 写法 ， 平 时 我 们 只 用 int， 是 因为 short int 中 的 short 可 以 省 略 。 


12.4 ”主机 字 节 序 和 网 络 字 节 序 


首先 要 理解 字 节 顺序 。 所 谓 字 节 顺 序 ， 是 指数 据 在 内 存 里 的 存储 顺序 。 
主机 字 节 序 就 是 在 主机 内 部 ， 数 据 在 内 存 中 的 存储 顺序 。 学 过 微机 原理 的 朋友 应 该 知道 ， 不 
E CPU 的 字 节 序 是 不 同 的 ， 所 谓 字 节 序 ， 就 是 一 个 数据 的 某 个 字 节 在 内 存 地 址 中 存放 的 顺序 ， 即 
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该 数据 的 低位 字 节 是 从 内 存 低地 址 开始 存放 还 是 从 高 地 址 开始 存放 。 主 机 字 节 序 通常 可 以 分 为 两 种 
模式 : 小 端 字 节 序 和 大 端 字 节 序 。 

为 什么 会 有 大 小 端 模式 之 分 呢 ? 这 是 因为 在 计算 机 系统 中 是 以 字 节 为 单位 的 ， 一 个 地 址 单元 
(存储 单元 ) 对 应 着 一 个 字 节 ， 即 一 个 存储 单元 存放 一 个 字 节 数 据 。 但 是 在 C 语言 中 ， 除 了 8bit 
的 char 型 之 外 ， 还 有 16bit 的 short 型 ，32bit 的 long 型 (要 看 具体 的 编译 器 ) 。 另 外 ， 对 于 位 数 大 
于 8 位 的 处 理 器 , 例如 16 位 或 者 32 位 的 处 理 器 , 由 于 寄存 器 宽度 大 于 一 个 字 节 ， 必 然 存在 着 多 个 
字 节 如 何 安排 的 问题 ， 这 就 导致 了 大 端 存 储 模式 和 小 端 存 储 模 式 。 例 如 一 个 16bit 的 short 型 x， 在 
内 存 中 的 地 址 为 0x0010，x 的 值 为 0x1122， 那 么 Ox11 为 高 字 节 ，0x22 为 低 字 节 。 对 于 大 端 模式 ， 
就 将 Ox 11 放 在 低地 址 中 ， 即 0x0010 中 ，0x22 放 在 高 地 址 中 ， 即 0x0011 中 。 小 端 模式 刚好 相反 。 
我 们 常用 的 x86 结构 是 小 端 模式 ， 而 KEIL C51 则 为 大 端 模式 。 很 多 ARM, DSP 都 为 小 端 模式 。 
有 些 ARM 处 理 器 还 可 以 由 硬件 来 选择 是 大 端 模式 还 是 小 端 模式 。 


CD 小 端 字 节 序 

小 端 字 节 序 (little-endian ) 就 是 数据 的 低 字 节 存 于 内 存 低地 址 中 ， 高 字 节 存 于 内 存 高 地 址 中 。 
比如 一 个 long 型 数据 0x12345678， 采 用 小 端 字 节 序 的 话 ， 它 在 内 存 中 的 存放 情况 是 这 样 的 : 

0x0029f458 0x78 // 低 内 存 地 址 存放 低 字 节 数据 

0x0029f459 0x56 

0x0029f45a 0x34 

0x0029f45b 0x12 // 高 内 存 地 址 存放 高 字 节 数据 

(2) 大 端 字 节 序 

大 端 字 节 序 (big-endian) 就 是 数据 的 高 字 节 存 于 内 存 低地 址 中 ， 低 字 节 存 于 内 存 高 地 址 中 。 
比如 一 个 long 型 数据 0x12345678， 采 用 大 端 字 节 序 的 话 ， 它 在 内 存 中 的 存放 情况 是 这 样 的 : 

0x0029f458 ”0x12 ”// 低 内 存 地 址 存放 高 字 节 数 据 

0x0029f459 0x34 


0x0029f45a 0x56 
0x0029f45b 0x79 ”// 高 内 存 地 址 存放 低 字 节 数据 


可 以 用 下 面 的 小 例子 来 测试 主机 的 字 节 序 。 
【 例 12.1】 测 试 主机 的 字 节 序 


(1) 新 建 一 个 Linux C++ 工程 ， 工 程 名 是 Test。 
(2) 在 Test.cpp 中 输入 代码 如 下 : 


#include <iostream> 
using namespace std; 


int main(int argc, char *argv[]) 
{ 
int nNum = 0x12345678; 
char *p = (char*)&nNum; //p 指 向 存储 nNum 的 内 存 的 低地 址 


if (*p == 0x12) cout << "This machine is big endian." << endl; // 判 断 低 地 
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址 是 否 存放 的 是 数据 高 位 


else cout «« "This machine is small endian." << endl; 


return 0; 


} 
首先 定义 nNum 为 int， 数 据 长 度 为 4 个 字 节 ， 然 后 定义 字符 指针 p 指向 nNum 的 地 址 ， 因 为 
字符 是 一 个 字 节 , 所 以 为 字符 指针 p 赋值 时 , 会 取 存 放 在 nNum 地 址 的 最 低 字 节 出 来 ， 即 p 指向 低 
地 址 。 如 果 *p 为 0x78 COx78 为 数据 的 低位 ，， 则 为 小 端 ， 如 果 * 为 Ox12 (0x12 为 数据 的 高 位 ) ， 
则 为 大 端 。 
(3) 保存 工程 并 运行 ， 运 行 结 果 如 图 12-2 所 示 。 


图 12-2 


这 个 机 子 是 x86 机 子 ，x86 机 子 基 本 都 是 小 端 模式 。 

在 网 络 上 有 着 各 种 各 样 的 主机 、 路 由 器 等 网 络 设备 ， 彼 此 的 机 器 字 节 序 都 是 不 同 的 ， 但 由 于 
它们 要 相互 传输 存储 数据 ， 必 须 统 一 它们 的 字 节 序 ， 因此 人 们 提出 了 网 络 字 节 序 。 网 络 字 节 顺 序 是 
TCP/IP 中 规定 好 的 一 种 数据 表示 格式 ， 它 与 具体 的 CPU 类 型 、 操 作 系 统 等 无 关 ， 从 而 可 以 保证 数 
据 在 不 同 主机 之 间 传 输 时 能 够 被 正确 解释 。 网络 字 节 顺 序 采 用 大 端 排序 方式 。 我 们 在 开发 网 络 程序 
的 时 候 , 应 该 保证 使 用 网 络 字 节 序 , 为 此 需要 将 数据 由 主机 的 字 节 序 转换 为 网 络 字 节 序 后 再 发 出 数 
据 ， 接 收 方 收 到 数据 后 也 要 先 转 为 主机 字 节 序 后 再 进行 处 理 。 这 个 过 程 在 跨 平台 开发 时 尤其 重要 。 

在 Linux 中 提供 了 几 个 主机 字 节 序 和 网 络 字 节 序 相互 转换 的 函数 ， 比 如 : 

uint16 t htons (uint16 t hosts); // 将 uint16 t (16 位 ) 类 型 的 数据 从 主机 字 节 序 转 为 网 络 
字 节 序 

uint32 t htonl(uint32 t hostl); // 将 uint32 t (32 位 ) 类 型 的 数据 从 主机 字 节 序 转 为 网 
络 字 节 序 

uint16 t ntohs (uint16 t nets); // 将 uint16 t (16 位 ) 类 型 的 数据 从 网 络 字 节 序 转 为 主机 
TE 

uint32 t ntohl(uint32 t netl); // 将 uint32 t (32 位 ) 类 型 的 数据 从 网 络 字 节 序 转 为 主机 
字 节 序 

使 用 这 些 函 数 的 时 候 ， 要 包含 头 文件 netinet/in.h， 即 #include <netinet/in.h>。 

值得 注意 的 是 ， 对 于 字 节 类 型 ， 是 不 存在 字 节 顺序 的 问题 的 〈 想 想 为 什么 ) ， 因 此 网 络 编程 
中 发 送 数据 和 接收 数据 的 函数 的 用 户 缓冲 区 指针 都 是 字符 或 字 节 类 型 ， 后 面 会 讲 到 这 点 。 





12.5 出 错 信息 的 获取 


网 络 编程 并 不 简单 ， 经 常会 发 生 各 种 各 样 的 问题 。 因 此 ， 获 取出 错时 的 信息 显得 尤为 重要 。 
有 些 socket 函数 可 以 通过 返回 值 来 判断 ， 但 并 不 全 面 。 实 际 在 网 络 编程 中 ， 很 多 情况 都 是 在 发 送 
和 接收 数据 时 出 现 了 socket 上 有 异常 ， 导 致 操作 无 法 完成 ， 而 返回 值 只 能 涉及 操作 相关 的 字 节 数 
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和 是 否 错误 ， 并 不 能 反映 完全 的 错误 信息 。 可 以 通过 下 面 几 种 方式 来 获取 更 为 全 面 的 出 错 信息 。 


CD 通过 全 局 变量 errno 

经 常 在 调用 Linux. 系统 API 的 时 候 会 出 现 一 些 错误 , 比如 使 用 函数 open, write 之 类 的 函数 时 ， 
有 时 会 返回 -1， 也 就 是 调用 失败 ， 往 往 需要 知道 失败 的 原因 。 这 个 时 候 使 用 errno 全 局 变量 就 相当 
有 用 了 。 

在 程序 代码 中 包含 ##nclude<errno.h>， 每 次 程序 调用 失败 的 时 候 ， 系 统 都 会 自动 用 错误 代码 
填充 ermo 全 局 变量 , 这 样 只 需要 读 erno 全 局 变量 就 可 以 获得 失败 原因 。 查 看 错误 代码 ermo 是 调 
试 程 序 的 一 个 重要 方法 。 当 linue API 函数 发 生 异 常 时 ,一 般 会 对 errno 变量 〈 需 包含 ermo.h) 赋 一 
个 整数 值 ， 不 同 的 值 表示 不 同 的 含义 ， 可 以 通过 查看 该 值 推测 出 错 的 原因 。 在 实际 编程 中 , 用 这 一 
招 解决 了 不 少 原本 看 来 莫名 其 妙 的 问题 。 


(2) 通过 函数 strerror 

这 个 函数 以 及 errno 全 局 变量 是 常用 的 获取 Linux 中 错误 信息 的 函数 ， 使 用 起 来 相当 顺手 ， 而 
且 这 个 函数 也 可 以 捕 提 所 有 Linux 中 的 错误 ， 因 为 其 使 用 的 错误 号 是 全 局 变量 。 劣 势 也 在 于 此 : 在 
获取 错误 时 不 能 完全 保证 这 个 错误 信息 就 是 之 前 的 ,很 有 可 能 在 获取 该 信息 时 错误 号 和 错误 信息 已 
经 再 度 更 新 了 ， 因 而 会 造成 误 判 。 在 网 络 编程 中 ， 特 别 是 在 异步 的 网 络 操作 时 ， 检 测 到 错误 后 ， 再 
去 获取 错误 是 有 时 间 差 的 ， 容 易 被 覆盖 修改 。 


(3) 通过 函数 gai_strerror 

有 很 多 socket 相关 的 函数 的 错误 号 和 错误 信息 是 无 法 通过 errno 或 strerror(errmno) 函 数 去 获取 
的 。 其 原因 在 于 很 多 函数 并 没有 将 ermo.h 作为 错误 码 。gai_strerror 根据 返回 的 非 零 值 作为 参数 ， 
然后 返回 指向 对 应 的 出 错 信 息 字符 串 的 指针 ， 其 原型 如 下 : 





#include <netdb.h> 
char *gai strerror(int error); 
(4) 通过 函数 getsockopt 
当 该 函数 的 第 3 个 参数 是 SO_ERROR 时 ， 可 以 获取 fd 上 的 错误 信息 。 如 果 epoll 获取 select, 
poll 检测 到 fd 上 有 异常 ,那么 通过 getsockopt 的 SO ERROR 来 获取 fd 上 的 错误 码 无 疑 是 最 准确 的 。 
该 函数 的 原型 如 下 : 
#include <netinet/socket.h> 
int getsockopt(int sockfd, int level, int optname, void *optval, socklen t 
*optlen); 
综 上 所 述 , 这 些 错误 信息 的 获取 方式 各 有 优 缺 点 和 适宜 的 场景 , 大 家 可 以 根据 使 用 场景 合理 地 
去 调用 。 这 里 只 需要 了 解 ， 后 面 在 实际 编程 中 会 讲 到 这 些 函 数 的 用 法 。 这 里 提 到 这 些 主要 是 让 大 家 
知道 网 络 编程 经 常会 有 各 种 意 想不到 的 情况 出 现 ， 要 有 获取 错误 信息 的 能 力 ， 以 便 分 析 问题 。 
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13.1 TCP 套 接 字 编 程 的 基本 步骤 


流 式 套 接 字 编程 针对 的 是 TCP 协议 通信 , 即 面向 连接 的 通信 , 分 为 服务 器 端 和 客户 端 两 部 分 ， 
分 别 代表 两 个 通信 端点 。 下 面 介 绍 流 式 套 接 字 编 程 的 基本 步骤 。 
服务 器 端 编程 的 步骤 如 下 : 


(1) 创建 服务 端 套 接 字 (使 用 socket) 。 

(2) 绑 定 套 接 字 到 一 个 IP 地 址 和 一 个 端口 上 (使 用 函数 bind) 。 

COD 将 套 接 字 设 置 为 监听 模式 等 待 连接 请 求 〈 使 用 函数 isten) ， 这 个 套 接 字 就 是 监听 套 接 字 了 。 

(4) 请 求 到 来 后 ， 接 受 连接 请 求 ， 返 回 一 个 新 的 对 应 此 次 连接 的 套 接 字 (Caccept) 。 

G) 用 返回 的 新 的 套 接 字 和 客户 端 进行 通信 ， 即 发 送 或 接收 数据 (使 用 函数 send 或 recv) ， 
通信 结束 就 关闭 这 个 新 创建 的 套 接 字 使 用 函数 closesocket) 。 

(6) 监听 套 接 字 继续 处 于 监听 状态 ， 等 待 其 他 客户 端的 连接 请 求 。 

CD 如 果 要 退出 服务 器 程序 ， 则 先 关 闭 监 听 套 接 字 ( 使 用 函数 closesocket) 。 


客户 端 编程 的 步骤 如 下 : 


(1) 创建 客户 端 套 接 字 〈 使 用 函数 socket) 。 

(0 向 服务 器 发 出 连接 请 求 〈 使 用 函数 connect) o 

G) 和 服务 器 端 进行 通信 ， 即 发 送 或 接收 数据 (使 用 函数 send 或 recv) 。 
(4) 如 果 要 关闭 客户 端 程序 ， 则 先 关 闭 套 接 字 (使 用 函数 closesocket) 。 


下 面 用 图 13-1 来 解释 这 些 步 又 。 
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结束 连接 readO 

I close) 

"e 
图 13-1 


13.2. By S FORO HERE 


MURRER PNRA, TE Linux H, HZ SIR OUR, XT AEDUESXAE PF 开 
头 ， 比 如 IPv4 协议 能 为 PF_INET，PF 的 意思 是 PROTOCOL FAMILY, fE bits/socket.h 中 定义 了 
不 同 协议 的 宏 定义 : 

/* Protocol families. */ 


#define PF UNSPEC 0  /* Unspecified. */ 
#define PF LOCAL 1  /* Local to host (pipes and file-domain). */ 


$define PF UNIX PF LOCAL /* POSIX name for PF LOCAL. */ 

#define PF FILE PF LOCAL /* Another non-standard name for PF LOCAL. */ 
#define PF INET 2  /* IP protocol family. */ 

#define PF AX25 3  /* Amateur Radio AX.25. */ 

#define PF IPX 4  /* Novell Internet Protocol. */ 


#define PF APPLETALK 5  /* Appletalk DDP. */ 

#define PF NETROM 6  /* Amateur radio NetROM. */ 
#define PF BRIDGE 7  /* Multiprotocol bridge. */ 
#define PF ATMPVC 8  /* ATM PVCs. */ 

#define PF X25 9  /* Reserved for X.25 project. */ 
#define PF INET6 10 /* IP version 6. */ 

#define PF ROSE 11 /* Amateur Radio X.25 PLP. */ 
#define PF DECnet 12 /* Reserved for DECnet project. */ 
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#define PF NETBEUI 13 /* Reserved for 802.2LLC project. */ 
#define PF SECURITY 14 /* Security callback pseudo AF. */ 
#define PF KEY 15 /* PF KEY key management API. */ 
#define PF NETLINK 16 

#define PF ROUTE PF NETLINK /* Alias to emulate 4.4BSD. */ 
#define PF PACKET 17 /* Packet family. */ 

#define PF ASH Ie /* Ash. 二 大 

#define PF ECONET 19 /* Acorn Econet. */ 

#define PF_ATMSVC 20. /* ATM SVCS. */ 


#define PF RDS 21 /* RDS sockets. */ 
#define PF SNA 22 /* Linux SNA Project */ 
#define PF IRDA 23 /* IRDA sockets. */ 


#define PF PPPOX 24 /* PPPoX sockets. */ 
$define PF WANPIPE 25 /* Wanpipe API sockets. */ 


#define PF LLC 26 /* Linux LLC. */ 

#define PF_CAN 29 /* Controller Area Network. */ 
#define PF TIPC 30. /* TIPC sockets. */ 

#define PF BLUETOOTH 31 /* Bluetooth sockets. */ 
#define PF IUCV 32 /* IUCV sockets. */ 

#define PF_RXRPC 33 /* RxRPC sockets. */ 

#define PF_ISDN 34 /* mISDN sockets. */ 


#define PF_PHONET 35 /* Phonet sockets. */ 
#define PF IEEE802154 36 /* IEEE 802.15.4 sockets. */ 


#define PF CAIF 37 /* CAIF sockets. */ 
#define PF ALG 38 /* Algorithm sockets. */ 
#define PF NFC 39 /* NFC sockets. */ 
#define PF MAX 40. /* For now.. */ 


db fct E ANRE P RUE f Ar. EHI ZR Eh, AEREE 
AF 开头 ， 比 如 IP 地 址 簇 为 AF_INET，AF 的 意思 是 ADDRESS FAMILY, f£ bits/socket.h 中 定义 
了 不 同 协议 的 宏 定义 : 

/* Address families. */ 


#define AF UNSPEC PF UNSPEC 
#define AF LOCAL PF LOCAL 


$define AF UNIX PF UNIX 
#define AF FILE PF FILE 
#define AF INET PF INET 
#define AF AX25 PF AX25 
#define AF IPX PF IPX 


$define AF APPLETALK PF APPLETALK 
#define AF NETROM PF NETROM 
$define AF BRIDGE PF BRIDGE 
$define AF ATMPVC PF ATMPVC 


#define AF X25 PF X25 
#define AF INET6 PF INET6 
#define AF ROSE PF ROSE 


#define AF DECnet PF DECnet 
#define AF NETBEUI PF NETBEUI 
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#define AF SECURITY PF SECURITY 
#define AF KEY PF KEY 
#define AF NETLINK PF NETLINK 
#define AF ROUTE PF ROUTE 
$define AF PACKET PF PACKET 
#define AF ASH PF ASH 
#define AF ECONET PF ECONET 
#define AF ATMSVC PF ATMSVC 


$define AF RDS PF RDS 
$define AF SNA PF SNA 
#define AF IRDA PF IRDA 


&define AF PPPOX PF PPPOX 
&define AF WANPIPE PF WANPIPE 


$define AF LLC PF LLC 

#define AF CAN PF CAN 

#define AF TIPC PF TIPC 

$define AF BLUETOOTH PF BLUETOOTH 
$define AF IUCV PF IUCV 

$define AF RXRPC PF RXRPC 
$define AF ISDN PF ISDN 

#define AF PHONET PF PHONET 
$define AF IEEE802154 PF IEEE802154 
$define AF CAIF PF CAIF 

$define AF ALG PF ALG 

#define AF NFC PF NFC 

$define AF MAX PF MAX 


TURAR, WARAN E, Ee WAER MERKRA RI HL 
那 为 什么 会 有 两 套 和 东西 呢 ? 这 是 因为 之 前 UNIX 有 两 种 风格 的 系统 : BSD 系统 和 POSIX 系统 ， 


T BSD 系统 ， 


一 直 用 的 是 AF， 对 于 POSIX 系统 ， 一 直 用 的 是 PF。Linux 作为 晚辈 ， 不 敢 得 罪 


位 大 哥 ， 所 以 这 两 种 都 支持 ， 这 样 两 位 大 哥 的 一 些 应 用 软件 都 可 以 在 Linux 上 运行 了 。 

Bell 实验 室 的 Ken Thompson 开始 利用 一 台 闲 置 的 PDP-7 计算 机 开发 了 一 种 多 用 户 、 多 任务 
操作 系统 。 很 快 , Dennis Richie 加 入 了 这 个 项 目 , 在 他 们 共同 的 努力 下 , 诞生 了 最 早 的 UNIX. Richie 
受 一 个 更 早 的 项 目 一 一 MULTICS 的 启发 ， 将 此 操作 系统 命名 为 UNIX。 早 期 UNIX 是 用 汇编 语言 


编写 的 ， 但 其 第 3 个 版 本 用 一 种 疡 新 的 编程 语言 C 重新 设计 了 。C 是 Richie 设计 出 来 并 








用 于 编写 


操作 系统 的 程序 语言 。 通 过 这 次 重新 编写 ，UNIX 得 以 移植 到 更 为 强大 的 DEC PDP-11/45 5 11/70 


计算 机 上 运行 。 后 来 发 生 的 一 切 正 如 他 们 所 说 的 ， 已 经 成 为 历史 。UNIX 从 实验 室 走出 来 并 





作 系 统 的 主流 ， 现 在 几乎 每 个 主要 的 计算 机 厂商 都 有 其 自 有 版 本 的 UNIX. 

随 着 UNIX 的 成 长 ， 后 来 占领 了 市 场 ， 公 司 多 了 ， 人 懂得 人 也 多 了 ， 就 分 家 了 。 后 来 UNIX K 
多 太 乱 ， 大 家 编程 的 接口 甚至 命令 都 不 一 样 了 ， 为 了 规范 大 家 的 使 用 和 开发 ， 就 出 现 了 POSIX 标 
准 。 典 型 的 POSIX 标准 的 UNIX 实现 有 Solaris, AIX 等 。 

BSD 则 代表 Berkeley Software Distribution， 即 伯克利 软件 套件 , 是 20 世纪 70 年 代 ， 加州 大 学 伯 
克利 分 校对 贝尔 实验 室 的 UNIX 进行 一 系列 修改 后 的 版 本 ， 它 最 终 发 展 成 了 一 个 完整 的 操作 系统 ， 有 
着 自己 的 一 套 标 准 。 现 在 有 多 个 不 同 的 BSD 分 支 。 今天，BSD 并 不 特 指 任何 一 个 BSD 衍生 版 本 ， 而 


成 为 操 
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是 类 UNIX 操作 系统 中 的 一 个 分 支 的 总 称 。 典 型 的 代表 是 FreeBSD、NetBSD、OpenBSD 等 。 


13.3 socket 地 址 


一 个 套 接 字 代表 通信 的 一 端 ， 每 端 都 有 一 个 套 接 字 地 址 ， 这 个 socket 地 址 包含 IP 地 址 和 端口 


信息 。 有 了 耳 地 址 ， 就 能 从 网 络 中 识别 对 方 的 主机 ， 有 了 端口 ， 就 能 识别 对 方 主机 上 的 进程 。 





socket 地 址 可 以 分 为 通用 socket 地 址 和 专用 socket 地 址 .前 者 会 出 现在 一 些 socket api 函数 中 ， 


比如 bind 函数 、connect 函数 等 。 后 者 主要 是 为 了 方便 使 用 而 提出 来 的 ， 两 者 可 以 相互 转换 。 
13.3.1 通用 socket 地 址 


通用 socket 地 址 就 是 一 个 结构 体 ， 名 字 是 sockaddr， 定 义 在 bits/socket.h 中 ， 注 意 是 bits 目录 


下 的 socket.h， 而 不 是 sys/socket.h。 该 结构 体 如 下 : 


#include <bits/socket.h> 
/* Structure describing a generic socket address. */ 
struct sockaddr 
{ 
SOCKADDR COMMON (sa ); 
char sa data[14]; /* Address data. */ 
n 


其 中 ，_SOCKADDR_COMMON 是 一 个 宏 ， 定 义 如 下 : 


#define | SOCKADDR COMMON (sa prefix) \ 
sa family t sa prefix##family 


这 个 宏 用 来 声明 socket 地 址 (比如 struct sockaddr, struct sockaddr in. struct sockaddr un 等 ) 
的 通用 成 员 , 检 是 C 语言 中 的 粘连 符 ,即将 前 后 字符 连接 起 来 .这 样 “SOCKADDR_COMMON (sa ) 


就 变 成 : 
sa family t sa pfamily 
而 类 型 sa family t 在 bit/sockaddr.h 的 定义 如 下 : 


/* POSIX.1g specifies this type name for the 'sa family' member. */ 
typedef unsigned short int sa family t; 


其 实 就 是 一 个 无 符号 的 短 整 型 (unsigned short int) .. ARINKA socket 地 址 结构 体 就 可 


struct sockaddr 
t 

sa family t sa pfamily; 

char sa data[14]; /* Address data. */ 
N 
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其 中 ，sa_pfamily 是 个 短 整 型 变量 ， 用 来 存放 地 址 艇 〈 或 协议 艇 ) 类 型 ， 常 用 取 值 如 下 。 


PF UNIX: UNIX 本 地 域 协议 徐 。 
PF INET: IPv4 HX. 
PF INET6: IPv6 HIZ. 
AF UNIX: UNIX 本 地 域 地 址 徐 。 
AF INET: IPv4 wik. 
AF_INET6: IPv6 35 3E, 


sa data 用 来 存放 地 址 数据 。 
由 于 sa data 只 有 14 字 节 ， 随 着 时 代 的 发 展 ， 一 些 新 的 协议 提出 来 了 ， 比 如 IPv6， 它 的 地 址 
长 度 不 够 14 字 节 ， 不 同 协议 簇 的 具体 地 址 长 度 如 表 13-1 所 示 。 


表 13-1 不 同 协议 得 的 具体 地 址 长 度 


协议 入 地 址 含义 和 长 度 
32 位 IPva 地 址 和 16 位 端口 号 ， 共 6 字 节 


128 位 IPv6 地 址 、16 位 端口 号 、32 位 流标 识 和 32 位 范围 ID， 共 26 字 节 
文件 全 路 径 名 ， 最 大 长 度 可 达 108 字 节 


sa data 太 小 了 ， 容 纳 不 下 了 ， 怎 么 办 呢 ? Linux 定义 了 新 的 通用 存储 结构 : 





#include <bits/socket.h> 
struct sockeaddr storage( 

sa family t sa family; 

unsigned long int ss align; 

char ss padding[128-sizeof( ss align)] 
) 


这 个 结构 体 存储 的 地 址 就 大 了 ， 而 且 是 内 存 对 齐 的 ， 我 们 可 以 看 到 有 __ss_align。 
13.3.2 ”专用 socket 地 址 


上 面 两 个 通用 地 址 结构 把 TP 地址 、 端 口 等 信息 一 股 脑 儿 放 到 一 个 char 数组 中 ， 使 得 使 用 起 来 
不 方便 。 为 此 ，Linux 为 不 同 的 协议 簇 定义 了 不 同 的 socket 地 址 结构 体 。 
IPv4 的 socket 地 址 定义 了 下 面 的 结构 体 : 
struct sockaddr inf 
sa family t sin family; // 地 址 和 能， 取 AF INET 
u intl6 t sin port; // 端 口号 ， 用 网 络 字 节 序 表示 
struct in addr sin addr; //ipv4 地 址 结构 ， 用 网 络 字 节 序 表示 


其 中 ，in_addr 定义 如 下 : 


typedef u32 _ bitwise _ be32; 
/* Internet address. */ 
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struct in addr ( 
be32 s addr; // 存 放 ipv4 地 址 ， 用 网 络 字 节 序 表示 ，be32 就 是 一 个 无 符号 的 32 位 整 型 
m 


再 看 IPv6 的 socket 地 址 专用 结构 体 : 


/* Ditto, for IPv6. */ 
struct sockaddr in6 
t 
sa family t sin6 family;  //NHhhLf&, 取 AF INET6 


in port t sin6 port; // 端 口号 ， 用 网 络 字 节 序 表 示 
uint32 t sin6 flowinfo; // IPv6 流 信息 ， 设 置 为 0 
struct in6 addr sin6 addr; // IPv6 地 址 

uint32 t sin6 scope id; //1iPv6 id 范围 


m 
其 中 ，in6_addr 定义 如 下 : 


// IPv6 address structure 
struct in6 addr ( 


union ( 
. u8 u6 addr8[16]; 
bel6 u6 addr16[8]; 
. be32 u6 addr32[4]; 
) in6 u; 
#define s6 addr in6 u.u6 addr8 
#define s6 addr16 in6 u.u6 addr16 
#define s6 addr32 in6 u.u6 addr32 


} 
UNIX 本 地 域 协议 簇 使 用 如 下 socket 地 址 结构 体 : 


#include <linux/un.h> 

#define UNIX PATH MAX 108 

struct sockaddr un ( 
. kernel sa family t sun family; // 地 址 和 能， 取 RAEF_UNIX 
char sun path[UNIX PATH MAX];  // 文件 全 路 径 名 


这 些 专用 的 socket 地 址 结构 体 显然 比 通用 的 socket 地 址 更 清楚 ， 把 各 个 信息 用 不 同 的 字段 来 


表示 。 但 要 注意 的 是 ，socket api 函数 使 用 的 是 通用 地 址 结构 ， 因 此 我 们 具体 使 用 的 时 候 ， 最 终 要 
把 专用 地 址 结构 转换 为 通用 地 址 结构 ， 不 过 可 以 强制 转换 。 


13.3.3 IP 地址 的 转换 


IP 地 址 转换 函数 用 于 完成 点 分 十 进 制 IP 地 址 与 二 进 制 IP 地 址 之 间 的 相互 转换 。IP 地 址 转换 


主要 有 inet_aton、inet_addr 和 inet_ntoa 三 个 函数 ， 这 三 个 地 址 转换 函数 都 只 能 处 理 IPv4 地 址 ， 而 
不 能 处 理 IPv6 地 址 。 


函数 inet_addr 将 点 分 十 进 制 IP 地 址 转换 为 二 进 制 地 址 ， 声 明 如 下 : 
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#include «sys/socket.h» 

#include «netinet/in.h» 

#include «arpa/inet.h» 

in addr t inet addr (const char *cp) 


其 中 ， 参 数 cp 为 点 分 十 进 制 IP 地 址 ， 如 “172.16.2.6”。 如 果 函 数 执行 成 功 ， 就 返回 二 进 制 
形式 的 IP 地 址 ， 类 型 是 32 位 无 符号 整 型 : 





typedef uint32 t in addr t; 
否则 返回 一 个 常 值 INADDR. NONE (32 位 均 为 1) 。 


/* Address indicating an error return. */ 
#define INADDR NONE ((unsigned long int) Oxffffffff) 


函数 inet. aton 将 点 分 十 进 制 IP 地 址 转换 为 二 进 制 地 址 ， 声 明 如 下 : 


#include <sys/socket.h> 

#include «netinet/in.h» 

#include «arpa/inet.h» 

int inet aton(const char *cp, struct in addr *inp); 


其 中 ， 参 数 cp 为 点 分 十 进 制 耻 地 址 ， 如 “172.16.2.6”; inp 用 来 存储 转换 后 的 二 进 制 地 址 信 
息 。 如 果 函 数 执行 成 功 ， 就 返回 非 0， 和 否则 返回 0。 
函数 inet_ntoa 将 二 进 制 地 址 转换 为 点 分 十 进 制 IP 地 址 ， 声 明 如 下 : 


#include <sys/socket.h> 

#include <netinet/in.h> 

#include «arpa/inet.h» 

char *inet ntoa(struct in addr in) 


其 中 ，in 存放 二 进 制 PP 地 址 。 如 果 函 数 执行 成 功 ， 就 返回 字符 串 指 针 ， 此 指针 指向 转换 后 的 
点 分 十 进 制 P 地 址 ， 否 则 返回 NULL. 


【 例 13.1】IP 地 址 字符 串 和 二 进 制 的 互 换 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 

#include «arpa/inet.h» 

int main(int argc, const char * argv[]) 

t 
struct in addr ia; 
inet aton("172.16.2.6", &ia); 
printf("ia.s addr-0x$xWn",ia.s addr); 
printf("real ip-$sMn",inet ntoa(ia)); 
return 0; 

$ 


代码 很 简单 ， 先 把 耳 172.16.2.6 转 为 二 进 制 存 于 ia， 然 后 打印 出 来 ， 再 转换 为 点 阵 的 字符 串 形式 。 
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(2) 上 传 到 Linux， 编 译 并 运行 : 


[root@localhost test]# ./test 
ia.s addr-0x60210ac 
real ip-172.16.2.6 


13.4 TCP 套 接 字 编 程 的 相关 函数 


13.4.1 socket 函数 

无 论 是 服务 端 还 是 客户 端 ， 都 需要 先 调 用 socket 函数 ， 用 于 建立 两 端 通信 的 端点 。 该 函数 声 
明 如 下 : 

#include <sys/types.h> 


#include <sys/socket.h> 
int socket(int domain, int type, int protocol); 


其 中 ， 参 数 domain 用 于 指定 协议 徐 ， 常 用 取 值 如 下 。 


€ AF NET: 使 用 IPv4 协议 。 

€ AF INET6: 使 用 IPv6 协议 。 

€ AF UNIX: 本 地 通信 ， 在 UNIX 和 Linux 系统 上 ， 一 般 都 是 当 客 户 端 和 服务 器 在 同 
一 台 机 器 上 的 时 候 使 用 。 

€ AF NETLINK: 内 核 和 用 户 之 间 的 通信 。 

参数 type 指定 产生 套 接 字 的 类 型 ， 通 常 取 值 如 下 。 


SOCK_STREAM: 表示 字 节 流 套 接口 ， 即 生成 的 socket 使 用 TCP 来 进行 通信 
SOCK DGRAM: 表示 数据 包 套 接 口 ， 即 生成 的 socket 使 用 UDP 来 进行 通信 
SOCK RAW: 表示 原始 套 接口 。 
SOCK RDM: 这 个 类 型 很 少 使 用 ， 在 大 部 分 的 操作 系统 上 没有 实现 ， 它 是 提供 给 数 
据 链 路 层 使 用 的 ， 不 保证 数据 包 的 顺序 。 

参数 protocol 通常 取 0， 如 果 在 原始 套 接 字 下 ， 则 取 一 个 常数 值 ， 到 第 15 章 再 具体 讲述 。 
如 果 函 数 执行 成 功 ， 则 返回 一 个 正 整 数值 ， 该 值 通常 称 为 套 接 字 描述 符 ， 如 果 函 数 执行 失败 ， 
则 返回 -1。 

下 面 演 示 socket 函数 的 使 用 : 


E » 


int sockfd; 
if( (sockfd = socket(AF INET,SOCK STREAM,0))«0 ) // 建 立 一 个 socket 


{ 
printf ("创建 套 接 字 失 败 !\n"); 
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return -1; 


) 


13.4.2 bind 函数 
该 函数 让 本 地 地 址 信息 关联 或 称 绑 定 ) 到 一 个 套 接 字 Cocke 函数 产生 的 套 接 字 ) 上 ， 例 如 
对 应 AF_ INET, AF INET6 就 是 把 一 个 IPv4 或 IPv6 地 址 和 端口 号 组 合 赋 给 socket。 它 既 可 以 用 于 
连接 的 〈 流 式 ) 套 接 字 也 可 以 用 于 无 连接 的 (数据 报 ) 套 接 字 。 当 新 建 一 个 套 接 字 后 ， 套 接 字数 据 
结构 中 有 一 个 默认 的 IP 地 址 和 默认 的 端口 号 。 服务 器 程序 必须 调用 bind 函数 来 给 其 绑 定 自己 的 IP 
地 址 和 一 个 特定 的 端口 号 .客户 端 程序 一 般 不 必 调 用 bind 函数 来 为 其 套 接 字 绑 定 TP 地 址 和 端口 号 ， 
客户 端 程序 通常 会 用 默认 的 IP 和 端口 来 与 服务 器 程序 通信 。bind 函数 声明 如 下 : 
#include <sys/socket.h> 
int bind( int sockfd, const struct sockaddr * addr, Socklen t addrlen); 
其 中 ， 参 数 sockfd 标识 一 个 待 绑 定 的 套 接 字 描 述 符 〈 由 socket 函数 产生 ) ; addr 是 一 个 结构 
体 sockaddr 的 指针 ， 指 向 要 绑 定 给 sockfd 的 协议 地 址 ， 这 个 地 址 结构 根据 创建 socket 时 的 地 址 协 
议 簇 的 不 同 而 不 同 ， 如 IPv4 对 应 的 是 : 
struct sockaddr in { 
sa family t sin family; /* address family: AF INET */ 
in port t sin port;  /* port in network byte order */ 


struct in addr sin addr;  /* internet address */ 


/* Internet address. */ 
struct in addr ( 


uint32 t S addr; /* address in network byte order */ 
IPv6 对 应 的 是 : 
struct sockaddr in6 { 

sa family t sin6 family;  /* AF INET6 */ 

in port t sin6 port; /* port number */ 

uint32 t sin6 flowinfo; /* IPv6 flow information */ 

struct in6 addr sin6 addr; /* IPv6 address */ 

uint32 t sin6 scope id; /* Scope ID (new in 2.4) */ 


struct in6 addr ( 
unsigned char  s6 addr[16];  /* IPv6 address */ 


UNIX 域 对 应 的 是 : 


#define UNIX PATH MAX 108 
struct sockaddr un { 
sa family t sun family; /* AF UNIX */ 
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char sun path[UNIX PATH MAX]; /* pathname */ 
N 


addrlen 指定 addr 的 缓冲 区 长 度 ，socklen_t 相当 于 int， 因 为 系统 相关 头 文件 中 有 定义 : 
typedef int socklen t; 
大 家 可 以 去 sys/socket.h 和 unistd.h 中 找到 它 。 因 此 要 使 用 socklen t， 需 要 包含 头 文件 : 


#include <sys/socket.h> 

#include <unistd.h> 

如 果 函 数 执行 成 功 ， 就 返回 零 ， 否 则 返回 -1， 可 用 通过 erno 查看 错误 码 。 

通常 服务 器 在 启动 的 时 候 会 绑 定 一 个 众所周知 的 地 址 〈 如 IP 地址 + 端口 号 ) ， 用 于 提供 服务 ， 
客户 可 以 通过 它 来 连接 服务 器 ， 而 客户 端 就 不 用 指定 ， 由 系统 自动 分 配 一 个 端口 号 和 自身 的 IP 地 
址 组 合 。 这 就 是 为 什么 通常 服务 器 端 在 listen 之 前 会 调用 bind 函数 ， 而 客户 端 就 不 会 调用 ， 而 是 在 
连接 (调用 connect 函数 ) 时 由 系统 随机 生成 一 个 。 

另外 要 注意 的 是 , 调用 bind 函数 前 设置 端口 号 时 , 一般 不 要 使 用 大 于 1024 的 值 , 因为 1~1024 
是 系统 保留 的 端口 号 。 

还 有 一 个 问题 要 注意 ， 一 个 程序 成 功 bind 后 ， 程 序 退出 再 次 运行 进行 bind 的 时 候 ， 会 提示 该 
套 接 字 地 址 〈(IP， 端 口 ) 已 经 被 占用 (错误 码 是 98) ， 而 上 次 进程 已 经 关闭 了 套 接 字 ， 为 什么 不 
能 马上 再 次 绑 定 呢 ? 这 是 由 TCP 套 接 字 的 状态 TIME WAIT 引起 的 ， 该 状态 在 套 接 字 关 闭 后 保留 
2~4 分 钟 。 在 TIME WAIT 状态 退出 之 后 ， 套 接 字 被 删除 ， 该 地 址 才能 被 重新 绑 定 而 不 出 问题 。 

等 待 TIME WAIT 结束 可 能 是 一 件 令 人 恼火 的 事 ， 特 别 是 当 你 正在 开发 一 个 套 接 字 服务 器 
时 ， 需 要 停止 服务 器 来 做 一 些 改动 ， 然 后 重启 。 幸 运 的 是 ， 有 方法 可 以 避 开 TIME WAIT 状态 。 
可 以 给 套 接 字 应 用 SO REUSEADDR 套 接 字 选 项 ， 以 便 端口 可 以 马上 重用 : 

int on = 1; 

setsockopt( sfp, SOL SOCKET, SO REUSEADDR, &on, sizeof(on) );// 人 允许 地 址 的 立即 
重用 


后 面 我 们 会 在 实例 中 验证 这 一 点 。 
下 面 的 代码 片段 演示 了 bind 函数 的 使 用 : 


#include <sys/socket.h> 


int listenfd,connfd; 

struct sockaddr in sockaddr; 
char buff [MAXLINE]; 

int n,port-10051; 


int on = 1; 
setsockopt (sfp, SOL SOCKET,SO REUSEADDR, &on, sizeof (on) ) ;// 人 允许 地 址 的 立即 重用 


memset (&sockaddr, 0, sizeof (sockaddr)) ; 
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Sockaddr.sin family = AF INET; 
Sockaddr.sin addr.s addr = htonl(INADDR ANY); // 接 受 任意 IP 地 址 的 客户 连接 
sockaddr.sin port = htons(port); //port 是 服务 器 端 指定 的 端口 号 
listenfd = socket (AF INET,SOCK STREAM,0); // 创 建 套 接 字 
if(-1--bind(listenfd, (struct sockaddr *) &sockaddr,sizeof (sockaddr) ) // 绑 定 协 
议 地 址 
t 
printf("failed to bind socket:$dMn",errno); 
return -1; 


13.4.3 listen 函数 
该 函数 用 于 服务 器 端的 流 套 接 字 ， 让 流 套 接 字 处 于 监听 状态 ， 监 听 客 户 端 发 来 的 建立 连接 的 
请 求 。 该 函数 声明 如 下 : 


#include <sys/socket.h> 
int listen( int s, int backlog); 


其 中 , 参数 s 是 一 个 流 套 接 字 描 述 符 ， 处 于 监听 状态 的 流 套 接 字 s 将 维护 一 个 客户 连接 请 求 队 
列 ; backlog 表示 连接 请 求 队列 所 能 容纳 的 客户 连接 请 求 的 最 大 数量 ， 或 者 说 队列 的 最 大 长 度 。 如 
果 函 数 执行 成 功 就 返回 零 ， 否 则 返回 -1。 

举 个 例子 ， 如 果 backlog 设置 为 5， 当 有 6 个 客户 端 发 来 连接 请 求 时 ， 那 么 前 5 个 客户 端 连 接 
会 放 在 请 求 队列 中 ， 第 6 个 客户 端 会 收 到 错误 。 

socket 函数 创建 的 套 接 字 默认 是 一 个 主动 套 接 字 ， 即 默认 是 一 个 将 调用 connect 函数 发 起 连接 
的 客户 端 套 接 字 ，listen 函数 将 该 套 接 字 变 为 被 动 套 接 字 ， 等 待 客户 的 连接 请 求 。 因 此 ， 对 于 TCP 
服务 器 ， 在 调用 bind 函数 后 ， 必 须要 调用 listen 函数 ， 使 其 变 为 被 动 套 接 字 ， 使 得 内 核能 接受 发 向 
该 套 接 字 的 连接 请 求 。 





13.4.4 accept 函数 

该 函数 用 于 服务 程序 从 处 于 监听 状态 的 流 套 接 字 的 客户 连接 请 求 队列 中 取出 排 在 最 前 面 的 一 
个 客户 端 请 求 ,并且 创建 一 个 新 的 套 接 字 来 与 客户 套 接 字 创建 连接 通道 , 如果 连接 成 功 ， 就 返回 新 
创建 的 套 接 字 的 描述 符 ， 以 后 就 用 新 创建 的 套 接 字 与 客户 套 接 字 相互 传输 数据 。 该 函数 声明 如 下 : 





#include <sys/socket.h> 

int accept( int s, struct sockaddr * addr, socklen t * addrlen); 

其 中 ,参数 s 为 处 于 监听 状态 的 流 套 接 字 描 述 符 ; addr 返回 新 创建 的 套 接 字 的 地 址 结构 :addrlen 
指向 结构 sockaddr 的 长 度 ， 表 示 新 创建 的 套 接 字 的 地 址 结构 的 长 度 。 如 果 函 数 执行 成 功 就 返回 一 
个 新 的 套 接 字 的 描述 符 ， 该 套 接 字 将 与 客户 端 套 接 字 进行 数据 传输 ， 并 且 参 数 addr 将 得 到 客户 端 
的 协议 地 址 , 包括 IP 和 端口 号 等 , 而 addrlen 将 得 到 客户 端 地 址 结构 的 大 小 Csocklen t 相当 于 int) 。 
如 果 执 行 失败 就 返回 -1， 可 以 从 errno 获取 错误 码 。 

下 面 的 代码 演示 了 accept 的 使 用 : 
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struct sockaddr in  NewSocketAddr; 
int addrlen; 
addrlen-sizeof (NewSocketAddr); 
int NewServerSocket-accept (ListenSocket, (struct sockaddr *)& NewSocketAddr, 
&addrlen); 
if(-1-- NewServerSocket) 
printf("failed to accept: $dWMn", errno); 


13.4.5 connect 函数 


该 函数 用 于 在 套 接 字 上 建立 一 个 TCP 连接 。 它 用 在 客户 端 ， 客 户 端 程序 使 用 connect 函数 请 
求 与 服务 器 的 监听 套 接 字 建 立 TCP 连接 。 该 函数 声明 如 下 : 














#include <sys/socket.h> 

int connect( int s, const struct sockaddr* name, Socklen t namelen); 

其 中 ， 参 数 s 为 还 未 连接 的 套 接 字 描述 符 ，name 是 服务 器 套 接 字 的 地 址 结构 的 指针 ; namelen 
是 name 所 指 套 接 字 地 址 结构 的 大 小 。 如 果 函 数 执行 成 功 就 返回 零 ， 否 则 返回 -1。 

建立 socket 后 默认 是 阻塞 套 接 字 ， 因 此 调用 connect 后 一 直 要 等 到 连接 成 功 或 超时 才能 返回 。 
在 大 多 数 实现 中 ，connect 的 超时 时 间 在 75 秒 至 几 分 钟 之 间 ， 想 要 缩短 超时 时 间 ， 解 决 问题 有 两 种 
方法 : 一 是 将 套 接 字 设置 为 非 阻塞 状态 ， 二 是 采用 信号 处 理 函 数 设置 阻塞 超时 控制 。 

对 于 一 个 阻塞 套 接 字 ， 该 函数 的 返回 值 表示 连接 是 否 成 功 ， 如 果 连 接 不 上 ， 通 常 要 等 较 长 时 
间 才 能 返回 ， 此 时 可 以 把 套 接 字 设 为 非 阻塞 方式 ， 然 后 设置 连接 超时 时 间 。 对 于 非 阻 塞 套 接 字 ， 由 
于 连接 请 求 不 会 马上 成 功 ， 因 此 函数 会 立即 返回 EINPROGRESS, 但 这 并 不 意味 着 连接 失败 ， 表 示 
连接 操作 正在 进行 中 ， 但 是 仍 未 完成 ， 同 时 TCP 的 三 路 握手 操作 继续 进行 。 在 这 之 后 ， 我 们 可 以 
调用 select 来 检查 这 个 链接 是 否 建立 成 功 。 

下 面 的 代码 片段 演示 了 阻塞 套 接 字 的 使 用 情况 : 








struct sockaddr in server address; 

bzero( &server address, sizeof( server address ) ); 
server address.sin family - AF INET; 

inet pton( AF INET, ip, &server address.sin addr ); 
server address.sin port - htons( port ); 


int sock = socket( PF INET, SOCK STREAM, 0 ); 
assert( sock »- 0 ); 


int sendbuf - atoi( argv[3] ); 

int len = sizeof( sendbuf ); 

setsockopt( sock, SOL SOCKET, SO SNDBUF, &sendbuf, sizeof( sendbuf ) ); 
getsockopt( sock, SOL SOCKET, SO SNDBUF, &sendbuf, ( socklen t* )&len ); 
printf( "the tcp send buffer size after setting is $dWMn", sendbuf ); 


int ret = connect( sock, ( struct sockaddr* )&server address, 
sizeof( server address ) ); 

printf("connect ret code is: $dWn", ret); 

if ( ret == -1 ) 
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printf("connect failed...\n"); 


下 面 的 代码 片段 演示 了 非 阻 塞 套 接 字 的 connect 函数 使 用 情况 : 


int setnonblocking( int fd ) 

t 
int old option - fcntl( fd, F GETFL ); 
int new option - old option | O NONBLOCK; 
fcntl( fd, F SETFL, new option ); 
return old option; 


int unblock connect( const char* ip, int port, int time ) 
t 

int ret = 0; 

struct sockaddr in address; 

bzero( &address, sizeof( address ) ); 

address.sin family = AF INET; 

inet pton( AF INET, ip, &address.sin addr ); 

address.sin port - htons( port ); 


int sockfd = socket( PF INET, SOCK STREAM, 0 ); 
int fdopt = setnonblocking( sockfd ); 
ret = connect( sockfd, ( struct sockaddr* )&address, sizeof( address ) ); 
printf("connect ret code = $dWn", ret); 
if ( ret == 0 ) 
t 
printf( "connect with server immediatelyMn" ); 
fcntl( sockfd, F SETFL, fdopt );  //set old optional back 
return sockfd; 
) 
//unblock mode --» connect return immediately! ret = -1 & errno-EINPROGRESS 
else if ( errno !- EINPROGRESS ) 
1 
printf("ret = $dWMn", ret); 
printf( "unblock connect failed!Wn" ); 
return -1; 
} 
else if (errno == EINPROGRESS) 
t 
printf( "unblock mode socket is connecting... Mn" ); 


//use select to check write event, if the socket is writable, then 
//connect is complete successfully! 

fd set readfds; 

fd set writefds; 

struct timeval timeout; 


FD ZERO( &readfds ); 
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FD SET( sockfd, &writefds ); 


timeout.tv sec = time; //timeout is 10 minutes 
timeout.tv usec - 0; 


ret = select( sockfd + 1, NULL, &writefds, NULL, &timeout ); 
if ( ret <= 0 ) 


t 
printf( "connection time outAn" ); 
close( sockfd ); 
return -1; 

) 


if ( ! FD ISSET( sockfd, &writefds ) ) 


printf( "no events on sockfd foundWn" ); 
close( sockfd ); 
return -1; 


int error = 0; 
Socklen t length = sizeof( error ); 
if( getsockopt( sockfd, SOL SOCKET, SO ERROR, &error, &length ) < 0 ) 
t 
printf( "get socket option failedWn" ); 
close( sockfd ); 
return -1; 


if( error != 0) 

t 
printf( "connection failed after select with the error: $d Mn", error ); 
close( sockfd ); 
return -1; 


//connection successful! 
printf( "connection ready after select with the socket: $d Wn", sockfd ); 
fcntl( sockfd, F SETFL, fdopt ); //set old optional back 
return sockfd; 
H 


后 面 会 举例 详细 讲述 这 两 种 情况 。 
13.4.6 write 函数 


write 函数 用 于 在 已 建立 连接 的 socket 上 发 送 数据 ， 无 论 是 客户 端 还 是 服务 器 应 用 程序 都 用 
write 函数 向 TCP 连接 的 另 一 端 发 送 数据 。 但 在 该 函数 内 部 ， 它 只 是 把 参数 buf 中 的 数据 发 送 到 套 
接 字 的 发 送 缓冲 区 中 , 此 时 数据 并 不 一 定 马上 成 功 地 被 传 到 连接 的 另 一 端 , 发 送 数据 到 接收 端 是 底 
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层 协议 完成 的 。 该 函数 只 是 把 数据 发 送 (或 称 复制 ) 到 套 接 字 的 发 送 缓冲 区 后 就 返回 了 。 该 函数 声 
明 如 下 : 





#include <unistd.h> 
int write( int s, const char* buf, int len); 


其 中 , 参数 s 为 发 送 端 套 接 字 的 描述 符 , 对 于 服务 器 而 言 是 accept 函数 返回 的 已 连接 的 套 接 字 
描述 符 ， 对 于 客户 端 而 言 是 调用 socket 函数 返回 的 套 接 字 描述 符 ，buf 存放 应 用 程序 要 发 送 的 数据 
的 缓冲 区 ， len 表示 buf 所 指 缓冲 区 的 大 小 。 如 果 函 数 复制 数据 成 功 ， 就 返回 实际 复制 的 字 节 数 ， 
如 果 函 数 在 复制 数据 时 出 现 错误 ，send 就 返回 -1。 

如 果 底 层 协议 在 后 续 的 数据 发 送 过 程 中 出 现 网 络 错误 , 那么 下 一 个 socket 函数 就 会 返回 -1 (这 
是 因为 每 一 个 除 send 外 的 socket 函数 在 执行 的 最 开始 总 要 先 等 待 套 接 字 的 发 送 缓冲 中 的 数据 被 协 
议 传送 完毕 才能 继续 ， 如 果 在 等 待 时 出 现 网 络 错误 ， 该 socket 函数 就 返回 -1) o 


13.4.7 read 函数 
该 函数 从 连接 的 套 接 字 或 无 连接 的 套 接 字 上 接收 数据 ， 该 函数 声明 如 下 : 





int read( int s, char* buf, int len); 


其 中 ， 参 数 s 为 已 连接 或 已 绑 定 〈 针 对 无 连接 ) 的 套 接 字 的 描述 符 ， 对 于 服务 器 而 言 是 accept 
函数 返回 的 已 连接 的 套 接 字 描述 符 ， 对 于 客户 端 而 言 是 调用 socket 函数 返回 的 套 接 字 描述 符 ;，buf 
指向 一 个 缓冲 区 ， 该 缓冲 区 用 来 存放 从 套 接 字 的 接收 缓冲 区 中 复制 得 到 的 数据 ，len 为 buf 所 指 组 
冲 区 的 大 小 。 如 果 函 数 执行 成 功 ， 则 返回 收 到 的 数据 的 字 节 数 ; 如 果 连 接 被 优雅 地 关闭 了 ， 则 函数 
返回 零 ， 如 果 发 生 错 误 ， 则 返回 -1。 





13.4.8 send 函数 


send 函数 和 write 函数 类 似 ， 都 是 用 来 发 送 数据 的 ， 只 不 过 多 了 一 个 附加 参数 ， 这 样 控制 更 灵 
活 些 。 函 数 声明 如 下 : 
#include <sys/socket.h> 


#include <sys/types.h> 
ssize_t send(int sockfd, const void *buf,size_t len, int flag); 


其 中 ， 前 3 个 参数 和 write 函数 的 参数 含义 相同 ;flag 参数 是 传输 控制 标志 ， 取 值 如 下 。 


(1) 0: 表示 常规 操作 ， 功 能 与 write 相同 。 

(2) MSG DONTROUTE: 通知 内 核 目 的 主机 在 直接 连接 的 本 地 网 络 上 , 不 需要 查询 路 由 表 。 

(3) MSG_DONTWAIT: 将 单个 IO 操作 设置 为 非 阻塞 模式 〈 不 需要 在 套 接 字 上 打开 非 阻塞 
标志 ) ， 然 后 执行 IO 操作 ， 最 后 关闭 非 阻塞 标志 。 

(4) MSG_OOB: 表明 发 送 的 数据 是 带 外 数据 。 


如 果 函 数 执行 成 功 ， 就 返回 写 出 的 字 节 数 ， 失 败 则 返回 -1。 
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13.4.9 recv 函数 


和 read 函数 类 似 ，recv 函数 也 是 用 于 数据 的 发 送 操作 ， 只 不 过 多 了 一 个 附加 参数 。 函 数 声明 
如 下 : 


#include <sys/socket.h> 
#include «sys/types.h» 
ssize t recv(int sockfd, void *buf, size t len, int flag); 


其 中 ， 前 3 个 参数 和 read 函数 的 参数 含义 相同 ，flag 参数 是 传输 控制 标志 ， 取 值 如 下 。 


(OD 0: 表示 常规 操作 ， 功 能 与 read 相同 。 

(2) MSG_DONTWAIT: 将 单个 IO 操作 设置 为 非 阻 塞 模式 〈 不 需要 在 套 接 字 上 打开 非 阻塞 
标志 ) ， 然 后 执行 IO 操作 ， 最 后 关闭 非 阻塞 标志 。 

(3) MSG_OOB: 指明 要 读 取 的 数据 是 带 外 数据 而 不 是 一 般 数 据 。 

(4) MSG PEEK: 可 以 查看 可 读 的 数据 ， 在 接收 数据 后 不 会 将 这 些 数据 丢弃 。 

(5) MSG_WAITALL: 通知 内 核 直 到 读 到 请 求 的 数据 字 节 数 时 ， 读 操作 才 返 回 。 


如 果 函 数 执行 成 功 ， 就 返回 读 入 数据 的 字 节 数 ， 出 错 则 返回 -1。 


13.4.10 close 函数 


close 函数 用 于 关闭 套 接 字 ， 并 立即 返回 。 不 再 使 用 的 套 接 字 应 该 最 后 关闭 它 。 关 闭 后 的 套 接 
字 描 述 符 将 不 能 再 接收 和 发 送 数据 。TCP 试 着 将 已 排队 的 待 发 数据 发 送 完 ， 然 后 按照 正常 TCP XE 
接 终 止 的 操作 关闭 连接 。close 关闭 套 接 字 描述 符 本 质 上 只 是 将 描述 符 的 访问 计数 减 1， 如 果 此 时 
描述 符 的 访问 计数 仍旧 大 于 0， 就 不 会 引发 TCP 的 终止 连接 操作 ， 这 个 功能 在 并 发 服务 器 中 非常 
close 函数 声明 如 下 : 





#include <unistd.h> 
int close(int sockfd); 


其 中 ， 参 数 sockfd 是 要 关闭 的 套 接 字 描 述 符 。 函 数 调用 成 功 返 回 0， 出 错 返回 -1。 


13.4.11 ”获得 套 接 字 地 址 

一 个 套 接 字 绑 定 了 地 址 ， 就 可 以 通过 函数 来 获取 它 的 套 接 字 地 址 了 。 套 接 字 通信 需要 本 地 和 
远程 两 端 建立 套 接 字 ， 这 样 获取 套 接 字 地 址 可 以 分 为 获取 本 地 套 接 字 地 址 和 获取 远程 套 接 字 地 址 。 
其 中 ， 获 取 本 地 套 接 字 地 址 的 函数 是 getsockname， 这 个 函数 在 下 面 两 种 情况 下 可 以 获得 本 地 套 接 
字 地 址 。 


(1) 本 地 套 接 字 通 过 bind 函数 绑 定 了 地 址 。 
(2) 本 地 套 接 字 没有 绑 定 地 址 ， 但 通过 connect 函数 和 远程 建立 了 连接 ， 此 时 内 核 会 分 配 一 
个 地 址 给 本 地 套 接 字 。 
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getsockname 函数 声明 如 下 : 


#include <sys/socket.h> 
int getsockname(int sockfd, struct sockaddr *addr, socklen t *addrlen); 


其 中 ， 参 数 sockfd 是 套 接 字 描 述 符 ; addr 指向 存放 套 接 字 地 址 的 结构 体 指针 ，addrlen 是 结构 
体 sockaddr 的 大 小 。 


【 例 13.2】 绑 定 后 获取 本 地 套 接 字 地 址 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <stdlib.h> 

#include <sys/types.h> 

#include <stdio.h> 

#include <sys/socket.h> 

#include <netinet/in.h> 

#include <string.h> 

#include "unistd.h" 

#include "errno.h" 

#include «arpa/inet.h» //for inet ntoa 


int main() 

t 
int sfp, nfp; 
struct sockaddr in s add, c add; 
Socklen t sin size; 
unsigned short portnum - 10051; 
struct sockaddr in serv; 
Socklen t serv len = sizeof (serv); 


sfp = socket(AF INET, SOCK STREAM, 0); 
if (-1 -- sfp) 
t 
printf("socket fail ! \r\n"); 
return -1; 
} 
printf ("socket ok !\r\n"); 
printf ("ip=%s,port=%d\r\n", inet ntoa(serv.sin addr), 
ntohs(serv.sin port)); // 马 上 获取 


int on = 1; 
setsockopt(sfp, SOL SOCKET，SO_REUSEADDR，&on，sizeof (on));// 人 允许 地 址 的 立 








用 
bzero(&s add, sizeof(struct sockaddr in)); 
S add.sin family - AF INET; 
S add.sin addr.s addr = inet addr("192.168.0.2"); // 这 个 ip 地 址 必须 是 本 机 
上 有 的 


S add.sin port = htons (portnum); 
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if (-1 == bind(sfp, (struct sockaddr *) (gs add), sizeof (struct sockaddr))) 


// 绑 定 
t 
printf("bind fail:$d!NrWn", errno); 
return -1; 
) 
printf("bind ok !WVrWn"); 
getsockname(sfp, (struct sockaddr *)&serv,&serv len) ;// 获 取 本 地 套 接 字 地 址 
// 打 印 套 接 字 地 址 里 的 ip 和 端口 值 
printf ("ip=%s,port=%d\r\n", inet ntoal(serv.sin addr), 
ntohs(serv.sin port)); 
return 0; 


) 
在 代码 中 ， 我 们 首先 创建 套 接 字 ， 马 上 获取 它 的 地 址 信息 ， 然 后 绑 定 IP 和 端口 号 ， 再 去 获取 
套 接 字 地 址 。 运 行 时 可 以 看 到 没有 绑 定 前 获取 到 的 都 是 0， 绑 定 后 就 可 以 正确 获取 到 了 。 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 编 译 并 运行 : 


[root@localhost ~]# cd /zww/test 
[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

Socket ok ! 

ip-0.0.0.0,port-0 

bind ok ! 

ip-192.168.0.2,port-10051 


要 注意 的 是 ，192.168.0.2 必须 是 本 机 上 存在 的 IP 地 址 ， 如 果 随 便 设 一 个 并 不 存在 的 IP 地 址 ， 
程序 就 会 返回 错误 ， 大 家 可 以 修改 一 个 并 不 存在 的 IP 地 址 后 编译 运行 ， 应 该 会 出 现下 面 的 结果 : 





[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

socket ok ! 

ip-0.0.0.0,port-0 

bind fail:99! 


getpeername 只 有 在 连接 建立 以 后 才 调 用 ， 和 否则 不 能 正确 获得 对 方 的 地 址 和 端口 ， 所 以 它 的 参 
数 描述 字 一 般 是 已 连接 描述 字 而 非 监听 套 接 口 描述 字 。 


(3) gethostname 函数 举例 。 
gethostname.c 源 代码 如 下 : 


#include <stdio.h> 
#include <string.h> 
#include <unistd.h> 


int main() 
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char hostname[30] ; 
int flag =0 ; 
memset (hostname, 0x00, sizeof (hostname)); 
flag = gethostname (hostname, sizeof (hostname)); 
IEC Elay <0 
t 

perror("gethostname error") ; 

return -1 ; 
) 
printf( "hostname = $sWn", hostname) ; 
return 0 ; 


) 


编译 gcc gethostname.c -o gethostname. 
执行 .gethostname， 执 行 结果 如 下 : 


hostname = ubuntu 


(4) 通过 主机 名 或 域名 获取 IP 地 址 。 
通过 主机 名 或 域名 获取 网 络 信息 gethostbyname。 
所 需 头 文件 : 
#include «netinet/in.h» 
函数 说 明 : 
gethostbyname 会 返回 一 个 hostent 结构 指针 ， 该 结构 具体 说 明 如 下 : 


struct hostent { 
char *h name; /* 正 式 的 主机 名 称 */ 
char **h aliases; /* 该 主机 的 其 他 别名 */ 


int h addrtype; /* 地 址 类 型 ， 通 常 是 AF_INET*/ 
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int h length; /* 地 址 的 长 度 */ 


char **h addr list;  /* 该 主机 的 所 有 地 址 */ 


NH 
函数 原型 : 


struct hostent *gethostbyname (const char *name) 
函数 传 入 值 如 下 。 


name: 域名 或 主机 名 。 
函数 传 出 值 如 下 。 


name: 主机 的 名 称 
函数 返回 值 如 下 。 


成 功 : 返回 hostent 指针 。 
失败 : NULL， 失 败 原 因 存 于 h error 中 (注意 错误 原因 不 存 于 error 中 ) 。 


附加 说 明 : 


该 函数 首先 在 /etc/hosts 文件 中 查找 是 否 有 匹配 的 主机 名 。 如 果 没 有 ， 则 到 域名 解析 配置 文件 
中 去 查找 主机 名 。 
(5) gethostbyname 函数 举例 。 
gethostbyname.c 源 代码 如 下 : 


#include 


#include 


#include 


#include 


#include 


#include 


<stdio.h> 
<stdlib.h> 
<errno.h> 
<netdb.h> 
<sys/types.h> 


<netinet/in.h> 


int main(int argc, char *argv[]) 


t 


struct hostent *h; 


if (argc != 2) ( /* error check the command line */ 


fprintf(stderr,"usage: getip address Vn"); 
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return -1; 

} 

if ((hegethostbyname(argv[1])) == NULL) ( /* get the host info */ 
herror("gethostbyname"); 
return -1; 

) 

printf("Host name : %s\n", h-»h name); 

printf("IP Address : $sWMn",inet ntoa(*((struct in_addr *)h-»h addr))); 

return 0; 

) 


13.4.12 ”阻塞 套 接 字 的 使 用 


当 使 用 函数 socket 创建 的 套 接 字 时 ， 默 认 都 是 阻塞 模式 的 。 阻 塞 模式 是 指 套 接 字 在 执行 操作 
时 ， 调 用 函数 在 没有 完成 操作 之 前 不 会 立即 返回 的 工作 模式 。 这 意味 着 当 调 用 API 函数 时 ， 不 能 
立即 完成 时 ， 线 程 处 于 等 待 状态 ， 直 到 操作 完成 。 值 得 注意 的 是 ， 并 不 是 所 有 的 Linux socket API 
以 阻塞 套 接 字 为 参数 调用 都 会 发 生 阻 塞 。 例 如 ， 以 阻塞 模式 的 套 接 字 为 参数 调用 bind0、listen() 时 ， 
函数 会 立即 返回 。 这 里 将 可 能 阻塞 套 接 字 的 Linsock API 调用 分 为 以 下 4 种 。 


(1) 接收 连接 函数 
函数 accept 从 请 求 连接 队列 中 接收 一 个 客户 端 连接 。 以 阻塞 套 接 字 为 参数 调用 这 些 函 数 时 ， 
若 请 求 队列 为 空 ， 则 函数 就 会 阻塞 ， 线 程 进入 睡眠 状态 。 


(2) 发 送 函 数 
函数 send. sendto 都 是 发 送 数据 的 函数 。 当 用 阻塞 套 接 字 作为 参数 调用 这 些 函数 时 ， 如 果 套 
接 字 缓 冲 区 没有 可 用 空间 ， 函 数 就 会 阻塞 ， 线 程 就 会 睡眠 ， 直 到 缓冲 区 有 空间 。 


(3) 接收 函数 

函数 recv 用 来 接收 数据 。 当 用 阻塞 套 接 字 为 参数 调用 这 些 函 数 时 ， 如 果 此 时 套 接 字 缓冲 区 没 
有 数据 可 读 ， 则 函数 阻塞 ， 调 用 线程 在 数据 到 来 前 处 于 睡眠 状态 。 

(4) 连接 函数 

函数 connect 用 于 向 对 方 发 出 连接 请 求 。 客 户 端 以 阻塞 套 接 字 为 参数 调用 这 些 函数 向 服务 器 发 
出 连接 时 ， 直 到 收 到 服务 器 的 应 答 或 超时 才 会 返回 。 

使 用 阻塞 模式 的 套 接 字 开发 网 络 程序 比较 简单 ， 容 易 实现 。 当 希望 能 够 立即 发 送 和 接收 数据 ， 
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且 处 理 


为 套 接 字 数量 较 少 的 情况 下 , 使 用 阻塞 套 接 字模 式 来 开发 网 络 程序 比较 合适 , 而 它 的 不 足 之 


处 表现 为 : 在 大 量 建立 好 的 套 接 字 线程 之 间 进 行 通信 比较 困难 。 当 希望 同时 处 理 大 量 套 接 字 时 ,将 
无 从 下 手 ， 扩展 性 差 。 


【 例 13.3] 一 个 简单 的 服务 器 客户 机 聊天 程序 ( 阻塞 套 接 字 版 ) 


( 





1) 首先 创建 服务 器 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdlib.h> 

#include <sys/types.h> 

#include <stdio.h> 

#include <sys/socket.h> 

#include <netinet/in.h> 

#include <string.h> 

#include "unistd.h" 

#include "errno.h" 

#include «arpa/inet.h» //for inet ntoa 


int main() 


( 


int sfp,nfp; 

struct sockaddr in s add,c add; 
Socklen t sin size; 

unsigned short portnum-10051; 


printf("Hello,I am a server,Welcome to connect me !\r\n"); 
sfp = socket(AF INET, SOCK STREAM, 0); 
if(-1 == sfp) 
t 
printf("socket fail ! \r\n"); 
return -1; 
) 
printf("socket ok !VrNn"); 


int on = 1; 
setsockopt( sfp, SOL SOCKET, SO REUSEADDR, &on, sizeof(on) ) ;// 人 允许 地 址 的 


立即 重用 


bzero(&s_add,sizeof (struct sockaddr in)); 
S add.sin family-AF INET; 

S add.sin addr.s addr-htonl(INADDR ANY); 
S add.sin port-htons (portnum); 


if(-1 == bind(sfp, (struct sockaddr *) (&s add), sizeof(struct sockaddr))) 
t 

printf("bind fail:%d!\r\n", errno); 

return -1; 
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} 
printf("bind ok !NVrNn"); 


if(-1 == listen(sfp,5)) // 在 套 接 字 上 监听 
t 
printf("listen fail !\r\n"); 
return -1; 


) 
printf("listen ok\r\n"); 


while(1) 
t 


sin size = sizeof(struct sockaddr in); 


nfp = accept(sfp, (struct sockaddr *)(&c add), &sin size); 
if(-1 == nfp) 
t 


printf("accept fail !\r\n"); 
return -1; 


) 


printf("accept ok!\r\nServer start get connect from 


ip-$s,port-$dWMrWn",inet ntoa(c add.sin addr) ,ntohs(c add.sin port)); 


) 


if(-1 == write (nfp,"hello,client,you are welcome! \r\n",32)) 
{ 
printf("write fail!\r\n"); 
return -1; 
) 
printf("write ok!Nr Nn"); 
close(nfp); 


puts ("continue to listen(y/n)?"); 
char ch[2]; 
scanf("$s", ch, 2); // 读 控制 台 两 个 字符 ， 包 括 回 车 符 
if (ch[0] != 'y') // 如 果 不 是 y 就 退出 循环 
break; 


) 
printf("bye! Nn"); 


close(sfp); // 关 闭 套 接 字 


return 0; 


程序 很 简单 。 先 新 建 一 个 监听 套 接 字 ， 然 后 等 待 客户 端的 连接 请 求 ， 阻 塞 在 accept 函数 处 ， 
一 旦 有 客户 端 连接 请 求 来 了 ， 就 返回 一 个 新 的 套 接 字 ， 这 个 套 接 字 和 客户 端 进行 通信 ， 通 信 完 毕 就 
关 掉 这 个 套 接 字 。 而 监听 套 接 字 根据 用 户 的 输入 继续 监听 或 退出 。 
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(2) 保存 为 test.cpp， 上 传 到 Linux 后 编译 运行 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

Hello,I am a server,Welcome to connect me ! 
Socket ok ! 

bind ok ! 

listen ok 


(3) 下 面 我 们 创建 客户 端 代 码 ， 打 开 UE， 在 其 中 输入 代码 如 下 : 


#include <stdlib.h> 

#include <sys/types.h> 

#include <stdio.h> 

#include <sys/socket.h> 

#include <netinet/in.h> 

#include <string.h> 

#include <arpa/inet.h> //for inet addr 
#include "unistd.h" //for read 


int main() 
t 
int cfd; 
int recbytes; 
int sin size; 
char buffer[1024]-(0); 
struct sockaddr in s add,c add; 
unsigned short portnum-10051; 
char ip[]="172.16.2.7"; 


printf("this is client Vr in"); 


cfd = socket(AF INET, SOCK STREAM, 0); 
if(-1 == cfd) 
t 
printf("socket fail ! \r\n"); 
return -1; 
} 
printf ("socket ok !\r\n"); 


bzero(&s_add,sizeof (struct sockaddr in)); 
s_add.sin_family=AF_INET; 

S add.sin addr.s addr- inet addr (ip); 

S add.sin port-htons (portnum); 


if(-1 == connect (cfd, (struct sockaddr *) (&s add) , sizeof (struct sockaddr))) 
// 发 起 连接 
t 
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printf("connect fail !\r\n"); 
return -1; 


) 
printf("connect ok !WVr in"); 


if(-1 == (recbytes = read(cfd,buffer,1024))) // 接 收 数据 


t 
printf("read data fail !\r\n"); 
return -1; 


) 
printf("read ok:"); 


buffer[recbytes]-'V0'; 
printf("$sWNrWn",buffer); 


printf("press any key to quit"); 
getchar (); 

close(cfd); // 关 闭 套 接 字 

return 0; 


) 
(4). 保存 为 client.cpp， 上 传 到 Linux 后 ， 新 开启 一 个 终端 窗口 ， 然 后 编译 运行 : 


[root@localhost client]# g++ client.cpp -o client 
[root@localhost client]# ./client 

this is client 

socket ok ! 

connect ok ! 

read ok:hello,client,you are welcome! 


press any key to quit 


因为 前 面 的 服务 器 端 已 经 运行 了 ， 所 以 连接 成 功 ， 并 能 收 到 服务 器 端 发 来 的 数据 。 此 时 服务 
器 端 变 为 : 


Hello,I am a server,Welcome to connect me ! 

Socket ok ! 

bind ok ! 

listen ok 

accept ok! 

Server start get connect from ip-172.16.2.7,port-55890 
write ok! 


continue to listen(y/n)? 
如 果 要 停止 服务 器 ， 可 以 输入 n， 然 后 按 回 车 键 来 结束 程序 。 


【 例 13.4】 判 断 当前 套 接 字 是 否 为 阻塞 套 接 字 
(1) 打开 UE， 输 入 代码 如 下 : 
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#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 


<sys/socket.h> 
<arpa/inet.h> 
<assert.h> 
<stdio.h> 
<unistd.h> 
<string.h> 
<errno.h> 
<stdlib.h> 
«fcntl.h» 
«sys/time.h» 


int main( int argc, char* argv[] ) 


( 


int sock = socket( PF INET, SOCK STREAM, 0 ); 
assert( sock »- 0 ); 


int old option - fcntl( sock, F GETFL ); 


if (0= 


—(old option & O NONBLOCK)) 


printf("now socket is BLOCK mode An"); //0 is block mode 


else 


printf("now socket is NOT BLOCK mode Wn"); 
return 0; 


} 


可 见 ，socket 函数 创建 的 套 接 字 默 认 是 阻塞 套 接 字 。 判 断 套 接 字 是 否 阻 塞 可 以 通过 系统 调用 
fentl 先 获得 套 接 字 描 述 符 的 属性 标志 , 然后 和 O_NONBLOCK 进行 与 操作 , 看 是 否 为 0, 如 果 是 0, 
则 说 明 是 阻塞 套 接 字 。 


(2) 保存 为 test.cpp， 上 传 到 Linux 后 ， 新 开启 一 个 终端 窗口 ， 然 后 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
now socket is BLOCK mode 


【 例 13.5】 统 计 阻 塞 套 接 字 的 connect 超时 时 间 
(1) 打开 UE， 输 入 代码 如 下 : 


#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 


<sys/socket.h> 
<arpa/inet.h> 
<assert.h> 
<stdio.h> 
<unistd.h> 
<string.h> 
<errno.h> 
<stdlib.h> 
«fcntl.h» 
«sys/time.h» 


#define BUFFER SIZE 512 





Linux C 与 C++ 一 线 开发 实践 





int main( int argc, char* argv[] ) 


{ 


char ip[]="172.16.2.88"; // 本 机 的 ip 是 172.16.2.7，172.16.2.88 并 不 存在 
int port = 13334; 


struct sockaddr in server address; 

bzero( &server address, sizeof( server address ) ); 
server address.sin family = AF INET; 

inet pton( AF INET, ip, &server address.sin addr ); 
server address.sin port - htons( port ); 


int sock - socket( PF INET, SOCK STREAM, 0 ); 
assert( sock »- 0 ); 


int old option - fcntl( sock, F GETFL ); 
printf("noblock: $dWMn", old option & O NONBLOCK); //0 is block mode 


struct timeval tvl, tv2; 
gettimeofday (&tvl, NULL); 


int ret = connect( sock, ( struct sockaddr* )&server address, 
sizeof( server address ) ); 
printf("connect ret code is: $dWn", ret); 
if ( ret == 0 ) 
t 
printf("call getsockname ...Wn"); 
struct sockaddr in local address; 
Socklen t length; 
int ret - getpeername(sock, ( struct sockaddr* )&local address, 
&length); 
assert (ret == 0); 
char local[INET ADDRSTRLEN ]; 
printf( "local with ip: $s and port: $dWn", 
inet ntop( AF INET, &local address.sin addr, local, 
INET ADDRSTRLEN ), ntohs( local address.sin port ) ); 


char buffer[ BUFFER SIZE ]; 
memset( buffer, 'a', BUFFER SIZE ); 
send( sock, buffer, BUFFER SIZE, 0 ); 
} 
else if (ret == -1) 
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t 
gettimeofday(&tv2, NULL); 
suseconds t msec - tv2.tv usec - tvl.tv usec; 
time t sec = tv2.tv sec = tvl.tv sec; 
printf ("time used:%d.%fs\n", sec, (double)msec / 1000000 ); 
printf ("connect failed...\n"); 
if (errno == EINPROGRESS) 
{ 
printf ("unblock mode ret code...\n"); 
} 
} 
else 
{ 
printf ("ret code is: $dWn", ret); 
) 


close( sock ); 
return 0; 
) 
代码 中 ， 首 先 定义 了 和 本 机 IP 在 同一 子 网 的 不 真实 存在 的 IP。 如 果 不 是 同一 子 网 ，connect 
能 很 快 判断 出 这 个 IP 不 存在 ， 所 以 超时 时 间 较 短 。 而 定义 一 个 在 同一 子 网 的 假 IP， 则 要 等 网 关 回 
复 结果 后 connect 才 知 道 是 否 能 连通 。 如 果 我 们 的 计算 机 连 上 Internet， 再 定义 一 个 公 网 上 的 假 下 ， 
那么 超时 时 间 会 更 长 ， 因 为 要 等 很 多 网 关 、 路 由 器 等 信息 回复 后 ，connect 才能 知道 是 否 可 以 连 上 。 
不 过 ， 现 在 同一 子 网 里 的 假 PP 用 作 测 试 也 足够 了 。 


(20. 保存 为 testcpp， 上 传 到 Linux 后 ， 新 开启 一 个 终端 窗口 ， 然 后 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

noblock: 0 

connect ret code is: -1 

time used:3.0.032286s 

connect failed... 


可 以 看 到 ， 大 概 等 3 秒 后 ， 才 提示 connect 失败 了 。 


13.4.13” 非 阻塞 套 接 字 的 使 用 
把 套 接 字 设 为 非 阻塞 模式 后 ， 很 多 Linsock 函数 就 会 立即 返回 ， 但 并 不 意味 着 操作 已 经 完成 。 


【 例 13.6】 设 置 阻塞 套 接 字 为 非 阻塞 套 接 字 


(1) 打开 UE， 输 入 代码 如 下 : 
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#include <sys/socket.h> 
#include <arpa/inet.h> 
#include <assert.h> 
#include <stdio.h> 
#include <unistd.h> 
#include <string.h> 
#include <errno.h> 
#include <stdlib.h> 
#include «fcntl.h» 
#include <sys/time.h> 


int setnonblocking( int fd ) // 自 定义 函数 ， 用 于 设置 套 接 字 为 非 阻 塞 套 接 字 
( 

int old option = fcntl( fd, F GETFL ); 

int new option - old option | O NONBLOCK; 

fcntl( fd, F SETFL, new option ); 

return old option; 


int main( int argc, char* argv[] ) 


int sock = socket( PF INET, SOCK STREAM, 0 ); 
assert( sock »- 0 ); 


int old option - fcntl( sock, F GETFL ); 
if(0--(old option & O NONBLOCK)) 

printf("now socket is BLOCK modein"); //0 is block mode 
else 

printf("now socket is NOT BLOCK mode in"); 


setnonblocking (sock); 
old option - fcntl( sock, F GETFL ); 
if(0--(old option & O NONBLOCK)) 
printf("now socket is BLOCK mode\n"); //0 is block mode 
else 
printf("now socket is NOBLOCK modeWn"); 


return 0; 


) 


可 以 看 到 ， 在 调用 了 我 们 定义 的 setnonblocking 函数 后 ， 套 接 字 变 为 非 阻塞 套 接 字 。 实 际 功能 
也 是 通过 系统 调用 fcntl 来 实现 的 。 
(2) 保存 为 testcpp， 上 传 到 Linux 后 ， 新 开启 一 个 终端 窗口 ， 然 后 编译 运行 : 
[root@localhost test]# g++ test.cpp -o test 


[rootélocalhost test]# ./test 
now socket is BLOCK mode 
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now socket is NOBLOCK mode 
[5] 13.7] BIXEX. connect 超时 时 间 ( 非 阻塞 套 接 字 法 ) 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <sys/types.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <stdlib.h> 
#include <assert.h> 
#include <stdio.h> 
#include <time.h> 
#include <errno.h> 
#include «fcntl.h» 
#include «sys/ioctl.h» 
#include <unistd.h> 
#include <string.h> 


#define BUFFER SIZE 1023 


int setnonblocking( int fd ) 

t 
int old option - fcntl( fd, F GETFL ); 
int new option - old option | O NONBLOCK; 
fcntl( fd, F SETFL, new option ); 
return old option; 


int unblock connect( const char* ip, int port, int time ) 


int ret - 0; 

struct sockaddr in address; 

bzero( &address, sizeof( address ) ); 
address.sin family = AF INET; 

inet pton( AF INET, ip, &address.sin addr ); 
address.sin port - htons( port ); 


int sockfd = socket( PF INET, SOCK STREAM, 0 ); 
int fdopt - setnonblocking( sockfd ); 


ret = connect( sockfd, ( struct sockaddr* )&address, sizeof( address ) ); 
printf("connect ret code = $dWn", ret); 
if ( ret == 0 ) 


t 
printf( "connect with server immediatelyMn" ); 
fcntl( sockfd, F SETFL, fdopt ); //set old optional back 
return sockfd; 
) 
//unblock mode --» connect return immediately! ret — -1 & errno-EINPROGRESS 
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else if ( errno != EINPROGRESS ) 

t 
printf("ret = $dWMn", ret); 
printf( "unblock connect failed!Wn" ); 
return -1; 

} 

else if (errno == EINPROGRESS) 

t 


printf( "unblock mode socket is connecting...Mn" ); 


//use select to check write event, if the socket is writable, then 
//connect is complete successfully! 

fd set readfds; 

fd set writefds; 

struct timeval timeout; 


FD ZERO( &readfds ); 
FD SET( sockfd, &writefds ); 


timeout.tv sec = time; // 我 们 设置 超时 时 间 为 1 秒 ， 原 来 大 概 需 要 3 秒 


timeout.tv usec = 0; 


ret = select( sockfd + 1, NULL, &writefds, NULL, &timeout ); 
if ( ret <= 0 ) 
{ 

printf( "connection time out\n" ); 

close( sockfd ); 

return -1; 


if ( ! FD_ISSET( sockfd, &writefds ) ) 

t 
printf( "no events on sockfd foundWMn" ); 
close( sockfd ); 
return -1; 


int error = 0; 
Socklen t length = sizeof( error ); 
if( getsockopt( sockfd, SOL SOCKET, SO ERROR, &error, &length ) < 0 ) 
t 
printf( "get socket option failedWn" ); 
close( sockfd ); 
return -1; 
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printf( "connection failed after select with the error: $d Mn", error ); 
close( sockfd ); 
return -1; 


) 


//connection successful! 

printf( "connection ready after select with the socket: $d Mn", sockfd ); 
fcntl( sockfd, F SETFL, fdopt ); //set old optional back 

return sockfd; 


int main( int argc, char* argv[] ) 


if( argc <= 2 ) 

t 
printf( "usage: $s ip address port number\n", basename( argv[0] ) ); 
return 1; 


) 
const char* ip = argv[1]; 
int port = atoi( argv[2] ); 


int sockfd - unblock connect( ip, port, 1); 
if ( sockfd < 0) 
t 
printf("sockfd error! return -1An"); 
return 1; 


) 
//shutdown( sockfd, SHUT WR ); //disable read and write 
printf( "send data out\n" ); 
send( sockfd, "abc", 3, 0 ); 
shutdown( sockfd, SHUT WR ); //disable read and write 
close (sockfd); 
return 0; 
) 


在 代码 中 自 定义 函数 setnonblocking， 用 于 设置 套 接 字 为 非 阻塞 套 接 字 。 然 后 定义 一 个 函数 
unblock connect 用 于 连接 ， 并且 设 置 1 秒 作为 超时 时 间 。 而 实际 的 超时 返回 是 通过 select 函数 来 实 
现 的 。 


(2) 保存 为 testcpp， 上 传 到 Linux 后 ， 新 开启 一 个 终端 窗口 ， 然 后 编译 运行 : 


[root@localhost test]# ./test 172.16.2.88 11133 kkk 
connect ret code = —1 

unblock mode socket is connecting... 

connection failed after select with the error: 113 
sockfd error! return -1 


172.16.2.88 是 Linux 主机 IP 的 同一 网 段 的 一 个 假 IP， 原 来 阻塞 超时 需要 3 秒 左右 ， 现 在 大 概 
需要 1 秒 左 右 ， 说 明 我 们 自 定义 的 超时 实际 生效 了 ; 11133 是 端口 kkk 是 我 们 想 要 发 送 的 信息 。 
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在 一 个 TCP 套 接口 被 设置 为 非 阻 塞 之 后 调用 connect, connect 会 立即 返回 EINPROGRESS 错 
误 ， 表 示 连 接 操作 正在 进行 中 ， 但 是 仍 未 完成 。 同 时 TCP 的 三 路 握手 操作 继续 进行 ， 在 这 之 后 ， 
我 们 可 以 调用 select 来 检查 这 个 链接 是 否 建立 成 功 。 

非 阻 塞 connect 有 以 下 3 种 用 途 。 


CD 我 们 可 以 在 三 路 握手 的 同时 做 一 些 其 他 的 处 理 。connect 操作 要 花 一 个 往返 时 间 完 成 ， 而 
且 可 以 是 在 任何 地 方 ,从 几 毫 秒 的 局 域 网 到 几 百 毫秒 或 几 秒 的 广域网 , 在 这 段 时 间 内 , 我 们 可 能 有 
一 些 其 他 的 处 理想 要 执行 。 

(2) 可 以 用 这 种 技术 同时 建立 多 个 连接 ， 在 Web 浏览 器 中 很 普遍 。 

(3) 由 于 我 们 使 用 select 来 等 待 连接 的 完成 ， 因 此 可 以 给 select 设置 一 个 时 间 限 制 ， 从 而 缩 
短 connect 的 超时 时 间 。 在 大 多 数 实际 环境 ( 公 网 ) P, connect 的 超时 时 间 在 75 秒 到 几 分 钟 之 间 。 
有 时 候 应 用 程序 想 要 一 个 更 短 的 超时 时 间 ， 使 用 非 阻塞 connect 就 是 一 种 方法 。 


非 阻塞 connect 听 起 来 虽然 简单 ， 但 是 仍然 有 一 些 细节 问题 要 处 理 : 


(1) 即使 套 接口 是 非 阻塞 的 ， 如 果 连 接 的 服务 器 在 同一 台 主 机 上 ， 那 么 在 调用 connect 建立 
连接 时 ， 连 接 通常 会 立即 建立 成 功 。 我 们 必须 处 理 这 种 情况 。 

(22 有 两 条 与 select 和 非 阻塞 IO 相关 的 规则 : 一 是 当 连 接 建立 成 功 时 ， 套 接口 描述 符 变 成 可 
写 ; 二 是 当 连 接 出 错时 ， 套 接口 描述 符 变 成 既 可 读 又 可 写 。 


值得 注意 的 是 ， 当 一 个 套 接口 出 错时 ， 它 会 被 select 调用 标记 为 既 可 读 又 可 写 。 
这 里 总 结 一 下 处 理 非 阻塞 connect 的 步骤 。 


第 一 步 : 创建 socket， 返 回 套 接口 描述 符 。 
第 二 步 : 调用 fent 把 套 接 口 描述 符 设 置 成 非 阻塞 。 
第 三 步 : 调用 connect 开始 建立 连接 。 
第 四 步 : 判断 连接 是 否 成 功 建立 。 

WMR connect 返回 0， 表 示 连 接 成 功 〈 服 务 器 和 客户 端 在 同一 台 机 器 上 时 就 有 可 能 发 生 这 种 情 
Wo. 

调用 select 来 等 待 连接 建立 成 功 完成 。 

如 果 select 返回 0， 则 表示 建立 连接 超时 。 我 们 返回 超时 错误 给 用 户 ， 同 时 关闭 连接 ， 以 防止 
三 路 握手 操作 继续 进行 下 去 。 

如 果 select 返回 大 于 0 的 值 ， 则 需要 检查 套 接口 描述 符 是 否 可 读 或 可 写 , 如 果 套 接口 描述 符 可 
读 或 可 写 ， 则 我 们 可 以 通过 调用 getsockopt 来 得 到 套 接口 上 待 处 理 的 错误 (SO_ERROR) ， 如 果 连 
接 建 立成 功 ， 这 个 错误 值 将 是 0， 如 果 建 立 连接 时 遇 到 错误 ， 则 这 个 值 是 连接 错误 所 对 应 的 ermo 
值 ， 比 如 ECONNREFUSED、ETIMEDOUT 等 。 


【 例 13.8】 自 定义 connect 超时 时 间 ( 信号 处 理 法 ) 
打开 UE， 输 入 代码 如 下 : 





* 516* 
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#include <sys/socket.h> 
#include «arpa/inet.h» 
#include <assert.h> 
#include <stdio.h> 
#include <unistd.h> 
#include <string.h> 
#include <errno.h> 
#include «stdlib.h» 
#include «fcntl.h» 
#include <sys/time.h> 
#include <signal.h> 


#define BUFFER SIZE 512 


void u alarm handler(int n) 


( 


int main( int argc, char* argv[] ) 


( 


char ip[]-"172.16.2.88"; // 本 机 的 ip 是 172.16.2.7，172.16.2.88 并 不 存在 
int port = 13334; 


struct sockaddr in server address; 

bzero( &server address, sizeof( server address ) ); 
server address.sin family = AF INET; 

inet pton( AF INET, ip, &server address.sin addr ); 
server address.sin port - htons( port ); 


int sock = socket( PF INET, SOCK STREAM, 0 ); 
assert( sock »- 0 ); 


int old option = fcntl( sock, F GETFL ); 
printf("noblock: %d\n", old option & O NONBLOCK); //0 is block mode 


struct timeval tvl, tv2; 
gettimeofday(&tvl1, NULL); 


Sigset(SIGALRM, u alarm handler); 
alarm(1);// 设 置 1 秒 超时 


int ret = connect( sock, ( struct sockaddr* )&server address, 
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sizeof( server address ) ); 
alarm(0); 
sigrelse(SIGALRM); 


printf("connect ret code is: %d\n", ret); 
if ( ret == 0 ) 
t 
printf("call getsockname ...n"); 
struct sockaddr in local address; 
socklen t length; 
int ret - getpeername(sock, ( struct sockaddr* )&local address, 
&length); 
assert(ret -- 0); 
char local[INET ADDRSTRLEN ]; 
printf( "local with ip: $s and port: $dWMn", 
inet ntop( AF INET, &local address.sin addr, local, 
INET ADDRSTRLEN ), ntohs( local address.sin port ) ); 


char buffer[ BUFFER SIZE ]; 
memset( buffer, 'a', BUFFER SIZE ); 
send( sock, buffer, BUFFER SIZE, 0 ); 


) 
else if (ret -- -1) 
t 
gettimeofday(&tv2, NULL); 
suseconds t msec - tv2.tv usec - tvl.tv usec; 
time t sec = tv2.tv sec - tvl.tv sec; 
printf("time used:$d.$fsWMn", sec, (double)msec / 1000000 ); 
printf("connect failed...in"); 
if (errno -- EINPROGRESS) 
t 
printf("unblock mode ret code...Tn"); 
} 
} 
else 
t 


printf("ret code is: $dWMn", ret); 


close( sock ); 
return 0; 


l 
在 代码 中 ， 套 接 字 依然 是 阻塞 套 接 字 。 首先 定义 一 个 中 断 信 号 处 理 函数 u_alarm_handler, 用 于 
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超时 后 的 报警 处 理 ， 然 后 定义 一 个 1 秒 的 定时 器 ， 执 行 connect， 当 系统 connect 成 功 时 ， 则 系统 正 
常 执行 下 去 ; 如果 conect 不 成 功 阻 塞 在 这 里 ， 则 超过 定义 的 2 秒 后 ， 系 统 会 产生 一 个 信号 ， 触 发 
执行 u_alarm_handler 函数 ， 当 执行 完 u_alarm_handler 后 ， 程 序 将 继续 从 connect 的 下 面 一 行 执行 


下 去 。 


【 例 13.9】 一 个 简单 的 服务 器 客户 机 聊天 程序 ( 非 阻 塞 套 接 字 版 ) 
(1) 首先 创建 服务 器 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdlib.h> 

#include <sys/types.h> 

#include <stdio.h> 

#include <sys/socket.h> 

#include <netinet/in.h> 

#include <string.h> 

#include "unistd.h" 

#include "errno.h" 

#include «arpa/inet.h» //for inet ntoa 


int main() 


( 


立即 重用 


int sfp,nfp; 

struct sockaddr in s add,c add; 
Socklen t sin size; 

unsigned short portnum-10051; 


printf("Hello,I am a server,Welcome to connect me !\r\n"); 
sfp = socket(AF INET, SOCK STREAM, 0); 
if(-1 -- sfp) 
{ 
printf ("socket fail ! \r\n"); 
return -1; 
} 
printf ("socket ok !\r\n"); 


int on = 1; 
setsockopt( sfp, SOL SOCKET, SO REUSEADDR, &on, sizeof(on) ) ;// 人 允许 地 址 的 


bzero(&s add,sizeof (struct sockaddr in)); 
S add.sin family-AF INET; 

S add.sin addr.s addr-htonl(INADDR ANY); 
S add.sin port-htons (portnum); 


if(-1 == bind(sfp, (struct sockaddr *)(&s add), sizeof (struct sockaddr))) 
t 
printf("bind fail:$d!NVrWNn",errno); 
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) 


return -1; 


printf("bind ok !\r\n"); 


if(-1 == listen(sfp,5)) // 在 套 接 字 上 监听 


t 


) 


printf("listen fail !\r\n"); 
return -1; 


printf("listen okWMr An"); 


while(1) 


( 


sin size = sizeof(struct sockaddr in); 


nfp = accept(sfp, (struct sockaddr *)(&c add), &sin size); 
if(-1 == nfp) 


{ 
printf("accept fail !\r\n"); 
return -1; 


) 
printf("accept ok!VrWMnServer start get connect from 


ip-$s,port-$dWMrWn",inet ntoa(c add.sin addr) ,ntohs(c add.sin port)); 


) 


if(-1 == write (nfp,"hello,client,you are welcome! \r\n",32)) 
{ 
printf ("write fail!\r\n"); 
return -1; 
} 
printf ("write ok!\r\n"); 
close (nfp); 


puts ("continue to listen(y/n)?"); 

char ch[2]; 

scanf("$s", ch, 2); // 读 控制 台 两 个 字符 ， 包 括 回 车 符 
if (ch[0] != 'y') // 如 果 不 是 y 就 退出 循环 


break; 


printf ("bye!\n"); 
close (sfp); // 关 闭 套 接 字 


return 0; 


} 


程序 很 简单 。 先 新 建 一 个 监听 套 接 字 ， 然 后 等 待 客户 端的 连接 请 求 ， 阻 塞 在 accept 函数 处 ， 
一 旦 有 客户 端 连 接 请 求 来 了 ， 就 返回 一 个 新 的 套 接 字 ， 这 个 套 接 字 就 和 客户 端 进行 通信 , 通信 完毕 
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后 关 掉 这 个 套 接 字 。 而 监听 套 接 字 根据 用 户 的 输入 继续 监听 或 退出 。 
(2) 保存 为 test.cpp， 上 传 到 Linux 后 编译 运行 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

Hello,I am a server,Welcome to connect me ! 
Socket ok ! 

bind ok ! 

listen ok 


(3) 下 面 我 们 创建 客户 端 代码 ， 打 开 UE， 在 其 中 输入 代码 如 下 : 


#include <sys/types.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <stdlib.h> 
#include <assert.h> 
#include <stdio.h> 
#include <time.h> 
#include <errno.h> 
#include <fcntl.h> 
#include <sys/ioctl.h> 
#include <unistd.h> 
#include <string.h> 


#define BUFFER_SIZE 1023 


int setnonblocking( int fd ) 
t 


int old option fcntl( fd, F GETFL ); 
int new option old option | O NONBLOCK; 
fcntl( fd, F SETFL, new option ); 

return old option; 


int unblock connect( const char* ip, int port, int time 


int ret - 0; 

Struct sockaddr in address; 

bzero( &address, sizeof( address ) ); 
address.sin family = AF INET; 

inet pton( AF INET, ip, &address.sin addr ); 
address.sin port - htons( port ); 


int sockfd = socket( PF INET, SOCK STREAM, 0 ); 

int fdopt - setnonblocking( sockfd ); 

ret = connect( sockfd, ( struct sockaddr* )&address, sizeof( address ) ); 
printf("connect ret code = $dWn", ret); 
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if ( ret == 0 ) 
t 
printf( "connect with server immediatelyMn" ); 
fcntl( sockfd, F SETFL, fdopt );  //set old optional back 
return sockfd; 
) 
//unblock mode --» connect return immediately! ret = -1 & errno-EINPROGRESS 
else if ( errno !- EINPROGRESS ) 
t 
printf("ret = $dWMn", ret); 
printf( "unblock connect failed!Wn" ); 
return -1; 
) 
else if (errno == EINPROGRESS) 
t 


printf( "unblock mode socket is connecting...Mn" ); 


//use select to check write event, if the socket is writable, then 
//connect is complete successfully! 

fd set readfds; 

fd set writefds; 

struct timeval timeout; 


FD ZERO( &readfds ); 
FD SET( sockfd, &writefds ); 


timeout.tv sec - time; //timeout is 10 minutes 
timeout.tv usec = 0; 


ret = select( sockfd + 1, NULL, &writefds, NULL, &timeout ); 
if ( ret «- 0 ) 
t 

printf( "connection time out\n" ); 

close( sockfd ); 

return -1; 


if ( ! FD ISSET( sockfd, &writefds ) ) 

t 
printf( "no events on sockfd foundWMn" ); 
close( sockfd ); 
return -1; 


int. error = 0; 

socklen_t length = sizeof( error ); 

if ( getsockopt( sockfd, SOL SOCKET, SO ERROR, &error, &length ) < 0 ) 
t 
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int 


printf( "get socket option failed\n" ); 
close( sockfd ); 
return -1; 


} 

if( error != 0) 

t 
printf( "connection failed after select with the error: $d Mn", error ); 
close( sockfd ); 
return -1; 

) 


//connection successful! 


printf( "connection ready after select with the socket: $d Mn", sockfd ); 
fcntl( sockfd, F SETFL, fdopt ); //set old optional back 


printf("connect ok !NrNn"); 


int recbytes; 
int sin size; 
char buffer[1024]-(0); 


if(-1 == (recbytes = read(sockfd,buffer,1024))) 
t 

printf("read data fail !\r\n"); 

return -1; 


) 


printf("read ok:"); 


buffer[recbytes]-'N0'; 
printf ("$s\r\n",buffer); 


return sockfd; 


main( int argc, char* argv[] ) 


conat char 1plli= P17216207° 
int port = 10051; 


int sockfd = unblock connect( ip, port, 1); 
if ( sockfíd « 0 ) 
t 
printf("sockfd error! return -1\n"); 
return 1; 


// 接 收 数据 
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close (sockfd); 
return 0; 


) 
在 代码 中 ， 我 们 把 阻塞 套 接 字 设 置 为 非 阻塞 套 接 字 ， 然 后 conect 会 立即 返回 ， 并 且 erno 等 
T EINPROGRESS， 表 示 正 在 连接 过 程 中 。 


(4) 保存 为 client.cpp， 上 传 到 Linux 后 ， 新 开启 一 个 终端 窗口 ， 然 后 编译 运行 : 





[root@localhost client]# g++ client.cpp -o client 
[root@localhost client]# ./client 

connect ret code = -1 

unblock mode socket is connecting... 

connection ready after select with the socket: 3 
connect ok ! 

read ok:hello,client,you are welcome! 


因为 前 面 的 服务 器 端 已 经 运行 了 ， 所 以 连接 成 功 ， 并 能 收 到 服务 器 端 发 来 的 数据 。 此 时 服务 
器 端 变 为 : 


Hello,I am a server,Welcome to connect me ! 
Socket ok ! 

bind ok ! 

listen ok 


accept ok! 
Server start get connect from ip-172.16.2.7,port-55938 


write ok! 
continue to listen(y/n)? 


如 果 要 停止 服务 器 ， 可 以 输入 n， 然 后 按 回 车 键 来 结束 程序 。 


$14 UDPEERZAE 


UDP 套 接 字 就 是 数据 报 套 接 字 , 一 种 无 连接 的 Socket, 对 应 无 连接 的 UDP 应 用 。 在 使 用 TCP 
编写 的 应 用 程序 和 使 用 UDP 编写 的 应 用 程序 之 间 存 在 一 些 本 质 差异 ， 其 原因 在 于 这 两 个 传输 层 之 
间 的 差别 : UDP 是 无 连接 的 不 可 靠 的 数据 报 协议 ， 不 同 于 TCP 提供 面向 连接 的 可 靠 字 节 流 。 从 资 
源 的 角度 来 看 ，UDP 套 接 字 相对 来 说 开销 较 小 ， 因 为 不 需要 维持 网 络 连接 ， 而 且 因 为 无 须 花费 时 
间 来 连接 ， 所 以 UDP 套 接 字 的 速度 也 较 快 。 

因为 UDP 提供 的 是 不 可 靠 服务 ， 所 以 数据 可 能 会 丢失 。 如 果 数 据 非常 重要 ， 就 需要 小 心 编写 
UDP 客户 程序 ， 以 检查 错误 并 在 必要 时 重 传 。 实 际 上 ，UDP 套 接 字 在 局 域 网 中 是 非常 可 靠 的 。 


14.1 UDP 套 接 字 编程 的 基本 步骤 


在 UDP 套 接 字 程序 中 ， 客 户 不 需要 与 服务 器 建立 连接 ， 可 直接 使 用 sendto 函数 给 服务 器 发 送 
数据 报 。 同 样 ， 服 务 器 不 需要 接受 来 自 客户 的 连接 ， 可 直接 调用 recvfrom 函数 ， 等 待 来 自 某 个 客 
户 的 数据 到 达 。 图 14-1 展示 了 客户 与 服务 器 使 用 UDP 套 接 字 进 行 通信 的 过 程 。 
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图 14-1 
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编写 UDP 套 接 字 应 用 程序 ， 涉 及 的 步骤 说 明 如 下 。 
服务 器 : 


(1) 创建 套 接 字 描 述 符 (socket)。 

(2) 设置 服务 器 的 IP 地 址 和 端口 号 (需要 转换 为 网 络 字 节 序 的 格式 )。 
(GO 将 套 接 字 描述 符 绑 定 到 服务 器 地 址 (bind)。 

(4) 从 套 接 字 描述 符 读 取 来 自 客户 端的 请 求 并 取得 客户 端的 地 址 (recvfrom)。 
C5) 向 套 接 字 描 述 符 写 入 应 答 并 发 送 给 客户 端 (sendto )。 

C65 回 到 步骤 〈4)， 等 待 读 取 下 一 个 来 自 客户 端的 请 求 。 

客户 端 : 

CD 创建 套 接 字 描述 符 socket) 。 

(2) 设置 服务 器 的 P 地 址 和 端口 号 〈 需 要 转换 为 网 络 字 节 序 的 格式 ) 。 
(3) 向 套 接 字 描 述 符 写 入 请 求 并 发 送 给 服务 器 〈sendto) 。 

(4) 从 套 接 字 描述 符 读 取 来 自 服务 器 的 应 答 (recvffom) 。 

G) 关闭 套 接 字 描述 符 Close) 。 


了 解 了 套 接 字 编程 的 基本 步骤 后 ， 我 们 再 来 看 一 下 常用 的 UDP 套 接 字 函 数 。 


14.2 TCP 套 接 字 编 程 的 相关 函数 


套 接 字 创建 函数 socket()、 地 址 绑 定 函数 bind() 与 TCP 套 接 字 编 程 相同 ， 有 具体 可 参考 第 13 章 ， 
此 处 仅 介绍 消息 传输 函数 sendto() 与 recvfrom(). 


14.2.1 消息 发 送 函 数 sendto 和 sendmsg 


发 送 消息 时 ，send 只 可 用 于 基于 连接 的 套 接 字 ，send 和 write 唯一 的 不 同 是 标志 的 存在 ， 当 
标志 为 0 时 ，send 等 同 于 write. sendto 和 sendmsg 既 可 用 于 无 连接 的 套 接 字 ， 也 可 用 于 基于 连接 
的 套 接 字 。 但 一 般 这 两 个 函数 不 用 在 连接 套 接 字 上 。 

这 两 个 函数 用 来 发 送 消息 ， 函 数 原型 如 下 : 


#include <sys/types.h> 

#include <sys/socket.h> 

ssize t sendto(int sock, const void *buf, size t len, int flags, const struct 
Sockaddr *to, socklen t tolen); 

ssize t sendmsg(int sock, const struct msghdr *msg, int flags); 


其 中 ， 参 数 sock 表示 将 要 从 其 发 送 数据 的 套 接 字 ; buf 指向 将 要 发 送 数据 的 缓冲 区 ; len 是 以 
上 缓冲 区 的 长 度 ; flags 是 以 下 零 个 或 者 多 个 标志 的 组 合体 ， 可 通过 或 操作 连 在 一 起 。 


€ MSG DONTROUTE: 不 要 使 用 网 关 来 发 送 封包 ， 只 发 送 到 直接 联网 的 主机 。 这 个 标 
志 主 要 用 于 诊断 或 者 路 由 程序 。 
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MSG DONTWAIT: 操作 不 会 被 阻塞 。 

MSG EOR: 终止 一 个 记录 。 

MSG MORE: 调用 者 有 更 多 的 数据 需要 发 送 。 

MSG NOSIGNAL: 当 另 一 端 终 止 连接 时 ， 请 求 在 基于 流 的 错误 套 接 字 上 不 要 发 送 


SIGPIPE 信号。 
MSG OOB: 发 送 out-of-band 数据 (需要 优先 处 理 的 数据 ) ， 同 时 现行 协议 必须 支持 
这 种 操作 。 


to: 指向 存放 接收 端 地 址 的 区 域 ， 可 以 为 NULL。 
tolen: 是 以 上 结构 体 struct sockaddr 的 长 度 。 
msg: 指向 存放 发 送 消息 头 的 内 存 缓冲 ， 定 义 如 下 : 


struct msghdr ( 


H 


void *msg name; 
Socklen t msg namelen; 
struct iovec *msg iov; 
size t msg iovlen; 
void *msg control; 
Socklen t msg controllen; 
int msg flags; 


函数 成 功 执行 时 ， 返 回 已 发 送 的 字 节 数 。 失 败 返 回 -1， 错 误 码 errno 被 设 为 以 下 的 某 个 值 。 


14.2.2 


EACCES: 对 于 UNIX 域 套 接 字 ， 不 允许 对 目标 套 接 字 文件 进行 写 ， 或 者 路 径 前 驱 的 
一 个 目录 节点 不 可 搜索 。 

EAGAIN, EWOULDBLOCK: 套 接 字 已 标记 为 非 阻 塞 ， 而 发 送 操作 被 阻塞 。 
EBADF: sock 不 是 有 效 的 描述 词 。 

ECONNRESET: 连接 被 用 户 重 置 。 

EDESTADDRREQ: 套 接 字 不 处 于 连接 模式 ， 没 有 指定 对 端 地 址 。 

EFAULT: 内 存 空间 访问 出 错 。 

EINTR: 操作 被 信号 中 断 。 

EINVAL: 参数 无 效 。 

EISCONN: 基于 连接 的 套 接 字 已 被 连接 上 ， 同 时 指定 接收 对 象 。 
EMSGSIZE: 消息 太 大 。 

ENOMEM: 内 存 不 足 。 

ENOTCONN: 套 接 字 尚 未 连接 ， 目 标 没 有 给 出 。 

ENOTSOCK: sock 索引 的 不 是 套 接 字 。 

EPIPE: 本 地 连接 已 关闭 。 


消息 接收 函数 recvfrom 和 recvmsg 


这 两 个 函数 从 套 接 字 上 接收 一 个 消息 。 对 于 recvfrom 和 recvmsg， 可 同时 应 用 于 面向 连接 的 
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和 无 连接 的 套 接 字 。recv 一 般 只 用 在 面向 连接 的 套 接 字 ， 几 乎 等 同 于 recvfrom， 只 要 将 recvfrom 
的 第 5 个 参数 设置 NULL。 按 照 习 惯 ，recvfrom 和 recvmsg 一 般 用 于 无 连接 套 接 字 。 

如 果 消 息 太 大 ， 无 法 完整 存放 在 所 提供 的 缓冲 区 ， 根 据 不 同 的 套 接 字 ， 多 余 的 字 节 会 被 丢弃 。 
假如 套 接 字 上 没有 消息 可 以 读 取 , 除非 套 接 字 已 被 设置 为 非 阻塞 模式 ,否则 这 两 个 函数 将 会 阻塞 一 
直 等 到 消息 到 来 。 

这 两 个 函数 声明 如 下 : 

#include <sys/types.h> 

#include <sys/socket.h> 

Ssize t recvfrom(int sock, void *buf, size t len, int flags, struct sockaddr 


*from, socklen t *fromlen); 
Ssize t recvmsg(int sock, struct msghdr *msg, int flags); 


其 中 ， 参 数 sock 是 将 要 从 其 接收 数据 的 套 接 字 ; buf 为 存放 消息 接收 后 的 缓冲 区 ，len 为 buf 
所 指 缓冲 区 的 大 小 ;fags 是 以 下 一 个 或 者 多 个 标志 的 组 合体 ， 可 通过 或 操作 连 在 一 起 。 


€ MSG DONTWAIT: 操作 不 会 被 阻塞 ， 非 阻塞 ， 立 即 返回 ， 不 等 待 。 

€ MSG ERRQUEUE: 指示 应 该 从 套 接 字 的 错误 队列 上 接收 错误 值 ， 依 据 不 同 的 协议 ， 
错误 值 以 某 种 辅佐 性 消息 的 方式 传递 进来 ， 使 用 者 应 该 提供 足够 大 的 缓冲 区 。 错 误 以 
sock extended err 结构 形态 被 使 用 ， 定 义 如 下 : 


#define SO EE ORIGIN NONE 0 

#define SO EE ORIGIN LOCAL 1 

#define SO EE ORIGIN ICMP 2 

$define SO EE ORIGIN ICMP6 3 

struct sock extended err 

t 
u int32 t ee errno;  /* error number */ 
u int8 t ee origin; /* where the error originated */ 
u int8 t ee type; /* type */ 


u int8 t ee code; /* code */ 

u int8 t ee pad; 

u int32 t ee info; /* additional information */ 
u int32 t ee data; /* other data */ 


/* More data may follow */ 


€ MSG PEEK: 指示 数据 接收 后 ， 在 接收 队列 中 保留 原 数据 ， 不 将 其 删除 ， 随 后 的 读 
操作 还 可 以 接收 相同 的 数据 。 

€ MSG TRUNC: 返回 封包 的 实际 长 度 ， 即 使 它 比 所 提供 的 缓冲 区 更 长 ， 只 对 packet 
套 接 字 有 效 。 

© MSG WAITALL: 要 求 阻塞 操作 ， 直 到 请 求 得 到 完整 的 满足 。 然 而 ， 如 果 捕 捉 到 信 
号 、 错 误 或 者 连接 断 开 发 生 ， 或 者 下 次 被 接收 的 数据 类 型 不 同 ， 仍 会 返回 少 于 请 求 量 
的 数据 。 

€ MSG EOR: 指示 记录 的 结束 ， 返 回 的 数据 完成 一 个 记录 。 
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MSG TRUNC: 指明 报 尾部 数据 已 被 丢弃 ， 因 为 它 比 所 提供 的 缓冲 区 需要 更 多 的 空间 。 
MSG CTRUNC: 指明 由 于 缓冲 区 空间 不 足 ， 一 些 控制 数据 已 被 丢弃 。 

MSG OOB: 指示 接收 到 out-of-band 数据 (需要 优先 处 理 的 数据 ) 。 

MSG ERRQUEUE: 指示 除了 来 自 套 接 字 错误 队列 的 错误 外 ， 没 有 接收 到 其 他 数据 。 
From: 为 指向 存放 对 端 地 址 的 缓冲 区 指针 ， 如 果 为 NULL， 不 储存 对 端 地 址 ; fromlen 
是 一 个 输入 输出 参数 ， 作 为 输入 参数 ， 指 向 存放 表示 from 所 指 缓冲 区 的 最 大 长 度 ， 
作为 输出 参数 ， 指 向 存放 表示 from 所 指 缓冲 区 的 实际 长 度 ; msg 指向 存放 进入 消息 
头 的 内 存 缓冲 ， 结 构 形态 如 下 : 


struct msghdr ( 


void *msg name; /* optional address */ 

socklen t msg namelen; /* size of address */ 

struct iovec *msg iov; /* scatter/gather array */ 

size t msg iovlen; /* 4 elements in msg iov */ 

void *msg control; /* ancillary data, see below */ 
socklen t msg controllen; /* ancillary data buffer len */ 
int msg flags; /* flags on received message */ 


H 


函数 成 功 执行 时 ， 返 回 接收 到 的 字 节 数 ， 另 一 端 已 关闭 则 返回 0; 失败 收 返回 -1，errno 被 设 
为 以 下 的 某 个 值 。 





EAGAIN: 套 接 字 已 标记 为 非 阻塞 ， 而 接收 操作 被 阻塞 或 者 接收 超时 。 
EBADF: sock 不 是 有 效 的 描述 词 。 

ECONNREFUSE: 远程 主机 阻 绝 网 络 连接 。 

EFAULT: 内 存 空间 访问 出 错 。 

EINTR: 操作 被 信号 中 断 。 

EINVAL: 参数 无 效 。 

ENOMEM: 内 存 不 足 。 

ENOTCONN: 与 面向 连接 关联 的 套 接 字 尚 未 被 连接 上 。 

ENOTSOCK: sock 索引 的 不 是 套 接 字 。 


14.3 ”实战 UDP FRF 


了 解 了 基本 的 UDP 收发 函数 后 ， 接 着 进入 实战 环节 。 
【 例 14.1】 获 取 网 卡 IP 地 址 信息 ( UDP 套 接 字 版 ) 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <string.h> 
#include <sys/socket.h> 
#include <sys/ioctl.h> 
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#include «net/if.h» 
#include <stdio.h> 
#include «netinet/in.h» 
#include «arpa/inet.h» 
int main() 
{ 
int inet sock; 
struct ifreq ifr; // 定 义 网 口 请 求 结构 体 
inet sock = socket(AF INET, SOCK DGRAM, 0); 


strcpy(ifr.ifr name, "enol16777736"); 
//SIOCGIFRADDR 标 志 代表 获取 接口 地 址 
if (ioctl(inet sock, SIOCGIFADDR, &ifr) < 0) 
perror("ioctl"); 
printf("$sWin", inet ntoa(((struct 
sockaddr in*)&(ifr.ifr addr))-»sin addr)); 
return 0; 


) 


在 代码 中 ， 首 先 创 建 一 个 UDP 套 接 字 ， 然 后 把 本 机 的 一 个 网 卡 名 字 “eno16777736” 赋 值 给 
ifrifr name， 接 着 调用 ioctl 函数 获取 SIOCGIFADDR 信息 ， 即 网 络 接口 的 TP 地址 信息 。 


(2) 上 传 到 Linux， 然 后 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
morie 


该 全 是 笔者 CentOS 7 的 eno16777736 网 卡 的 IP 地 址 。 


【 例 14.2】 服 务 器 和 客户 端 通信 
CD 先 创建 服务 器 端的 程序 ， 打 开 UE， 输 入 代码 如 下 : 


#include <sys/types.h> 
#include <sys/stat.h> 
#include «fcntl.h» 
#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <strings.h> 
#include <unistd.h> 
#include <errno.h> 
#include <sys/stat.h> 
#include <dirent.h> 
#include <sys/mman.h> 
#include <sys/wait.h> 
#include <signal.h> 
#include <sys/ipc.h> 
#include <sys/shm.h> 
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#include <sys/msg.h> 
#include <sys/sem.h> 
#include <pthread.h> 
#include <semaphore.h> 
#include <poll.h> 
#include <sys/epoll.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <netinet/in.h> 


char rbuf[50]; 


int main() 


( 


int sockfd; 

int size; 

int ret; 

int on -1; 

struct sockaddr in saddr; 
struct sockaddr in raddr; 


// 设 置地 址 信息 ，ip 信 息 

size = sizeof(struct sockaddr in); 
bzero(&saddr,size); 

saddr.sin family - AF INET; 

saddr.sin port = htons (8888); 

saddr.sin addr.s addr = htonl(INADDR ANY); 


// 创 建 udp 的 套 接 字 
sockfd = socket (AF INET,SOCK DGRAM,0); 
if (sockfd<0) 
{ 
perror("socket failed"); 
return -1; 


// 设 置 端口 复 用 
setsockopt(sockfd,SOL SOCKET,SO REUSEADDR, &on,sizeof (on)); 


// 绑 定 地 址 信息 ，ip 信 息 
ret = bind(sockfd, (struct sockaddr*)&saddr,sizeof(struct sockaddr)); 
if (ret«0) 
t 
perror("sbind failed"); 
return -1; 
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Socklen t val = sizeof(struct sockaddr); 
// 循 环 接收 客户 端 发 来 的 消息 
while(1) 
t 
puts ("waiting data"); 
ret-recvfrom(sockfd,rbuf,50,0,(struct sockaddr*)&raddr,&val); 
if(ret «0) 
t 


perror("recvfrom failed"); 


printf("the data :$sWn",rbuf); 
bzero(rbuf,50); 

) 

// 关 闭 udp 套 接 字 ， 这 里 不 可 达 

close (sockfd); 

return 0; 


) 


代码 很 简单 ， 通 过 一 个 while 循环 等 待 客户 端 发 来 的 消息 。 没 有 数据 过 来 时 ， 就 在 recvfrom BR 
数 上 阻塞 着 。 
保存 为 test.cpp， 上 传 到 Linux， 然 后 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
waiting data 


(2) 创建 客户 端 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <sys/types.h> 
#include <sys/stat.h> 
#include «fcntl.h» 
#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <strings.h> 
#include «unistd.h» 
#include <errno.h> 
#include <sys/stat.h> 
#include <dirent.h> 
#include <sys/mman.h> 
#include <sys/wait.h> 
#include <signal.h> 
#include <sys/ipc.h> 
#include <sys/shm.h> 
#include <sys/msg.h> 
#include <sys/sem.h> 
#include <pthread.h> 
#include <semaphore.h> 
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#include <poll.h> 
#include <sys/epoll.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include «arpa/inet.h» 
#include <netinet/in.h> 


char wbuf [50]; 


int main() 


{ 


int sockfd; 

int size,on = 1; 

struct sockaddr in saddr; 
int ret; 


size = sizeof(struct sockaddr in); 
bzero(&saddr,size); 


// 设 置地 址 信息 、ip 信 息 

saddr.sin family = AF INET; 

saddr.sin port = htons (8888); 

Saddr.sin addr.s addr-inet addr("172.16.2.6");//172.16.2. 6 为 服务 端 所 在 的 ipP 


sockfd= socket(AF INET,SOCK DGRAM,0); // 创 建 udp 的 套 接 字 
if (sockfd«0) 
t 

perror("failed socket"); 

return -1; 


) 
// 设 置 端口 复 用 
setsockopt(sockfd,SOL SOCKET,SO REUSEADDR, &on,sizeof (on)); 


// 循 环 发 送信 息 给 服务 端 
while(1) 
t 
puts("please enter data:"); 
scanf("$s",wbuf); 
ret-sendto(sockfd,wbuf,50,0,(struct sockaddr*)&saddr, 
sizeof(struct sockaddr)); 
if (ret<0) 
t 
perror("sendto failed"); 


bzero(wbuf,50); 
H 
close (sockfd); 
return 0; 
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) 


代码 也 很 简单 ， 使 用 一 个 while 循环 等 待 用 户 输入 信息 ， 输 入 后 就 把 信息 发 送出 去 。 
保存 为 client.cpp， 上 传 到 Linux， 重 新 开 一 个 终端 ， 然 后 编译 运行 : 
[root@localhost client]# g++ client.cpp -o client 

[root@localhost client]# ./client 

please enter data: 


hi,server 
please enter data: 


发 送 消息 “hi,server” 后 ， 服 务 端 就 变 为 : 


waiting data 
the data :hi,server 
waiting data 


【 例 14.3】 实 现 简单 的 ifconfig 查询 功能 
(1) 打开 UE， 输 入 代码 如 下 : 


#include «net/if.h» /* for ifconf */ 
#include <linux/sockios.h> /* for net status mask */ 
#include <netinet/in.h> /* for sockaddr in */ 


#include «sys/socket.h» 
#include <sys/types.h> 

#include <sys/ioctl.h> 

#include <stdio.h> 

#include <unistd.h> //for close 
#include <arpa/inet.h> 

#include <string.h> 

#define MAX INTERFACE (16) 


void port status (unsigned int flags); 


/* set == 0: do clean , set == 1: do set! */ 
int set if flags(char *pif name, int sock, int status, int set) 
t 

struct ifreq ifr; 

int ret - 0; 


strncpy(ifr.ifr name, pif name, strlen(pif name) + 1); 
ret = ioctl(sock, SIOCGIFFLAGS, &ifr); 
if (ret) 
return -1; 
/* set or clean */ 
if (set) 
ifr.ifr flags |- status; 
else 
ifr.ifr flags &= -status; 
/* set flags */ 
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ret = ioctl(sock, SIOCSIFFLAGS, &ifr); 
if (ret) 
return -1; 


return 0; 


int get if info(int fd) 


struct ifreq buf[MAX INTERFACE]; 
struct ifconf ifc; 

int ret = 0; 

int if num - 0; 


ifc.ifc len = sizeof (buf); 
ifc.ifc buf (caddr t) buf; 


M 


ret = ioctl(fd, SIOCGIFCONF, (char*)&ifc); 
if (ret) 
t 
printf("get if config info failed"); 
return -1; 
) 
/* 网 口 总 数 ifc.ifc len 应 该 是 一 个 出 入 参数 */ 
if num = ifc.ifc len / sizeof(struct ifreq); 
printf("interface num is interface = $dWn", if num); 
while (if num-- > 0) 
t 
printf("net device: $sWn", buf[if num].ifr name); 
/* 获取 第 n 个 网 口 信息 */ 
ret = ioctl(fd, SIOCGIFFLAGS, (char*)&buf[if num]); 
if (ret) 
continue; 


/* 获取 网 口 状态 */ 
port status(buf[if num].ifr flags); 


/* 获取 当前 网 卡 的 ip 地 址 */ 
ret = ioctl(fd, SIOCGIFADDR, (char*)&buf[if num]); 
if (ret) 
continue; 
printf("IP address is: \n%ss\n", inet ntoa(((struct sockaddr in 
*)(&buf[if num].ifr addr))-»sin addr)); 


/* 获取 当前 网 卡 的 mac */ 
ret = ioctl(fd, SIOCGIFHWADDR, (char*)&buf[if num]); 
if (ret) 
continue; 
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printf("$02x:$02x:$02x:$02x:$02x:$02xWMn Wn", 


(unsigned 
(unsigned 
(unsigned 
(unsigned 
(unsigned 
(unsigned 


char)buf[if num].ifr hwaddr.sa data[0], 
char)buf[if num].ifr hwaddr.sa data[ll], 
char)buf[if num].ifr hwaddr.sa data[2], 
char)buf[if num].ifr hwaddr.sa data[3], 
char)buf[if num].ifr hwaddr.sa data[4], 
char)buf[if num].ifr hwaddr.sa data[5]); 


void port status(unsigned int flags) 


t 


if (flags & IFF UP) 


( 


printf("is upNn"); 


if (flags & IFF BROADCAST) 


printf("is broadcast in"); 


if (flags & IFF LOOPBACK) 


printf("is loop backin"); 


if (flags & IFF POINTOPOINT) 


printf("is point to point in"); 


if (flags & IFF RUNNING) 


printf("is runningNn"); 


if (flags & IFF PROMISC) 


printf("is promisc Nn"); 


int main() 


int fd; 


fd = socket(AF INET, SOCK DGRAM, 0); 
if (fd > 0) 


t 


get if info(fd); 
close(fd); 
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return 0; 


} 


在 代码 中 ， 首 先 创建 UDP 套 接 字 ， 然 后 通过 ioctl 函数 和 内 核 进 行 交互 ， 获 得 所 需要 的 信息 。 
ioctl 函数 在 驱动 编程 中 经 常会 碰 到 , 它 是 用 户 态 和 内 核 态 打交道 的 重要 途径 。 结 构 体 ifconf 通常 是 
用 来 保存 所 有 接口 信息 的 ， 定 义 如 下 : 


//if.h 
struct ifconf 
t 
int ifc len; /* size of buffer */ 
union 
t 
char *ifcu buf; /* input from user-»kernel*/ 
struct ifreq *ifcu req; /* return from kernel-»user*/ 
} ife ifcuūz 
n 
#define ifc buf ifc ifcu.ifcu buf /* buffer address */ 
#define ifc req ifc ifcu.ifcu req /* array of structures */ 


(20 保存 为 test.cpp， 上 传 到 Linux， 然 后 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

interface num is interface = 6 

net device: virbr0 

is up 

is broadcast 

IP address is: 

192.168.122.1 

00:00:00:00:00:00 


net device: eno67109432 
is up 

is broadcast 

is running 

IP address is: 

Tog Iq 
00:0c:29:3d:94:31 


net device: eno50332208 
is up 

is broadcast 

is running 

IP address is: 
192.168.0.2 
00:0c:29:3d:94:27 


net device: eno33554984 
is up 

is broadcast 

is running 

IP address is: 
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aq 
00:0c:29:3d:94:1d 

net device: eno16777736 
is up 

is broadcast 

is running 

is promisc 

IP address is: 

Alo sin 
00:0c:29:3d:94:13 


net device: lo 

is up 

is loop back 

is running 

IP address is: 
TIT 
00:00:00:00:00:00 


可 以 看 到 ， 本 机 所 有 网 卡 信息 都 列举 出 来 了 ， 效 果 和 ifconfig 命令 类 似 。 


14.4 UDP 丢 包 及 无 序 问题 


UDP 是 无 连接 的 面向 消息 的 数据 传输 协议 ， 与 TCP 相 比 ， 有 两 个 致命 的 缺点 ， 一 是 数据 包容 
易 丢 失 ， 二 是 数据 包 无 序 。 

丢 包 的 原因 通常 是 服务 器 端的 socket 接收 缓存 满 了 (UDP 没有 流量 控制 ， 因 此 发 送 速度 比 接 
收 速度 快 ， 很 容易 出 现 这 种 情况 ) ， 然 后 系统 就 会 将 后 来 收 到 的 包 丢 弃 ， 而 且 服 务 器 收 到 包 后 ， 还 
要 进行 一 些 处 理 , 而 这 段 时 间 客 户 端 发 送 的 包 没有 去 收 , 就 会 造成 丢 包 。 我 们 可 以 在 服务 端 单独 开 
一 个 线程 ， 去 接收 UDP 数据 ， 存 放 在 一 个 应 用 缓冲 区 中 ， 又 用 另外 的 线程 去 处 理 收 到 的 数据 ， 尽 
量 减 少 因 为 处 理 数据 延 时 造成 的 丢 包 。 但 这 个 办 法 不 能 从 根本 上 解决 问题 〈 只 能 改善 )， 在 数据 量 
比较 大 时 依然 会 丢 包 。 还 有 一 种 方法 就 是 让 客户 端 发 送 慢 点 (比如 增加 sleep 延 时 ) ， 但 这 也 是 权 
宜 之 计 。 

要 实现 数据 的 可 靠 传输 ， 就 必须 在 上 层 对 数据 丢 包 和 乱 序 做 特殊 处 理 ， 必 须要 有 丢 包 重 发 机 
制 和 超时 机 制 。 

常见 的 可 靠 传 输 算法 有 模拟 TCP 协议 和 重 发 请 求 (ARQ) 协议 ， 后 者 又 可 分 为 连续 ARQ 协 
议 、 选 择 重 发 ARQ 协议 、 滑 动 窗口 协议 等 。 如 果 只 是 小 规模 程序 ， 也 可 以 自己 实现 丢 包 处 理 ， 原 
理 基 本 上 就 是 给 数据 进行 分 块 ， 每 个 数据 包 的 头 部 添加 一 个 唯一 标识 序号 的 ID 值 ， 当 接收 的 包头 
部 ID 不 是 期 望 中 的 ID 号 时 ， 则 判定 丢 包 ， 将 丢 包 ID 发 回 服务 器 端 ， 服 务 器 端 接 到 丢 包 响应 则 重 
发 丢失 的 数据 包 。 

既然 用 UDP， 就 要 接受 丢 包 的 现实 ， 否 则 请 用 TCP。 如 果 必 须 使 用 UDP， 而 且 丢 包 又 是 
不 能 接受 的 ， 只 能 自己 实现 确认 和 重 传 ， 可 以 制定 上 层 的 协议 ， 里 面包 括 流 控制 、 简 单 的 超时 
和 重 传 机 制 。 
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15.1 原始 套 接 字 概述 


所 谓 原始 套 接 字 ， 是 指 在 传输 层 下 面 使 用 的 套 接 字 。 前 面 介绍 了 流 式 套 接 字 和 数据 报 套 接 字 
的 编程 方法 ,这 两 种 套 接 字 工 作 在 传输 层 , 主要 为 应 用 层 的 应 用 程序 提供 服务 ， 并且 在 接收 和 发 送 
时 只 能 操作 数据 部 分 ， 而 不 能 对 IP 首部 或 TCP 和 UDP 首部 进行 操作 ， 通 常 把 流 式 套 接 字 和 数据 
报 套 接 字 称 为 标准 套 接 字 ， 开 发 应 用 层 的 程序 用 这 两 类 套 接 字 就 够 了 。 但 是 ， 如果 我 们 开发 的 是 更 
底层 的 应 用 ， 比 如 发 送 一 个 自 定义 的 IP 包 、UDP 包 、TCP 包 或 ICMP 包 ， 捕 获 所 有 经 过 本 机 网 
卡 的 数据 包 ， 伪装 本 机 IP 地 址 ， 想 要 操作 IP 首部 或 传输 层 协议 首部 ， 等 等 ， 这 些 功 能 对 于 这 两 种 
套 接 字 就 无 能 为 力 了 。 这 些 功 能 需要 使 用 另 一 种 套 接 字 来 实现 ， 这 种 套 接 字 叫 作 原 始 套 接 字 (Raw 
Socket) ， 功 能 更 强大 ， 更 底层 。 原 始 套 接 字 可 以 在 链 路 层 收 发 数据 帧 。 在 Linux 下 ， 在 链 路 层 上 
收发 数据 帧 的 另外 两 种 通常 的 做 法 是 使 用 libpcap 和 libnet 两 个 开源 库 来 实现 。 


152 与 标准 套 接 字 的 区 别 


与 标准 套 接 字 编程 的 区 别 在 于 , 原始 套 接 字 可 以 自行 组 装 数据 包 ( 伪 装 本 地 IP. 和 本 地 MAC)， 
可 以 接收 本 机 网 卡 上 所 有 的 数据 帧 〈 数 据 包 ) 。 另 外 ， 必 须 在 管理 员 权限 下 才能 使 用 原始 套 接 字 。 
通常 情况 下 ， 所 接触 到 的 标准 套 接 字 〈socket) 分 为 两 类 : 


CD 流 式 套 接 字 (SOCK_STREAM) : 一 种 面向 连接 的 Socket， 对 应 面向 连接 的 TCP 服务 
应 用 。 
(20 数据 报 套 接 字 (SOCK_DGRAM) : 一 种 无 连接 的 Socket， 对 应 无 连接 的 UDP 服务 应 用 。 


而 原始 套 接 字 (SOCK_RAW) 与 标准 套 接 字 (SOCK STREAM. SOCK DGRAMD 的 区 别 在 
于 ， 原 始 套 接 字 直接 置 “ 根 ” 于 操作 系统 网 络 核心 (Network Core) ,而 SOCK_STREAM、 
SOCK DGRAM JlJ * Ei" F TCP 和 UDP 协议 的 外 围 ， 如 图 15-1 所 示 。 
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图 15-1 
流 式 套 接 字 只 能 收发 TCP 协议 的 数据 , 数据 报 套 接 字 只 能 收发 UDP 协议 的 数据 , 原始 套 接 
字 可 以 收发 没 经 过 内 核 协议 栈 的 数据 包 。 


15.3 ”原始 套 接 字 的 编程 方法 


原始 套 接 字 的 编程 方法 和 前 面 UDP 的 编程 方法 差不多 ， 也 是 创建 一 个 套 接 字 后 ， 通 过 这 个 套 
接 字 收 发 数据 。 重 要 的 区 别 是 原始 套 接 字 更 底层 ， 可 以 自行 封装 数据 包 ， 制 作 网 络 嗅 探 工具 ， 实 现 
拒绝 服务 攻击 (DOS) ， 实 现 IP 欺骗 ， 等 等 。 面 向 链 路 层 的 原始 套 接 字 用 于 在 MAC 层 (二 层 ) 
上 收发 原始 数据 帧 ， 这 样 就 允许 用 户 在 用 户 空间 完成 MAC 上 各 个 层次 的 实现 ， 给 无 论 是 进行 开发 
还 是 测试 的 人 带 来 极 大 的 便利 。 


15.4 面向 链 路 层 的 原始 套 接 字 编 程 函数 


值得 注意 的 是 ， 使 用 原始 套 接 字 的 函数 通常 需要 用 户 有 root 权限 。 
15.4.1 创建 原始 套 接 字 函数 


#include <netinet/in.h> 

int socket ( int family, int type, int protocol ); 

Hep, S% family s PHOUSK, 这 里 面向 链 路 层 ， 因 此 取 值 为 PF. PACKET: type 表示 套 接 字 
类 型 ， 有 两 种 类 型 〈 即 两 种 取 值 )， 一 种 为 SOCK_ RAW， 它 是 包含 MAC 层 头 部 信息 的 原始 分 组 ， 
就 是 接收 到 的 帧 包含 MAC 层 头 部 信息 ， 因 此 这 种 类 型 的 套 接 字 在 发 送 的 时 候 需要 自己 加 上 一 个 
MAC 头 部 ; 另 一 种 是 SOCK_DGRAM 类 型 ， 它 已 经 进行 了 MAC 层 头 部 处 理 ， 即 收 到 的 帧 已 经 去 
掉 了 头 部 ， 而 发 送 时 也 无 须 用 户 添加 头 部 字段 。 其 实 还 能 取 值 SOCK_PACKET， 但 是 已 经 废弃 ， 
以 后 不 保证 还 能 支持 ， 不 推荐 使 用 ， 可 能 大 家 在 维护 以 前 的 代码 时 会 看 到 它 。protocol 表示 我 们 关 
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心 的 协议 类 型 ， 相 当 于 指定 了 要 收发 的 数据 包 的 类 型 ， 不 能 取 0， 常 用 的 取 值 如 下 。 


ETH P IP: 只 接收 目的 mac 是 本 机 的 IP 类 型 的 数据 帧 。 

ETH P ARP: 只 接收 目的 mac 是 本 机 的 ARP 类 型 的 数据 帧 。 

ETH P RARP: 只 接收 目的 mac 是 本 机 的 RARP 类 型 的 数据 帧 。 

ETH P PAE: 只 接收 目的 mac 是 本 机 的 802.1x 类 型 的 数据 帧 。 

ETH P ALL: 接收 目的 mac 是 本 机 的 所 有 类 型 的 数据 帧 ， 同 时 还 可 以 接收 本 机 发 出 
的 所 有 数据 帧 ， 混 杂 模 式 打开 时 ， 还 可 以 接收 目的 mac 不 是 本 机 的 数据 帧 。 


通过 protocol 参数 还 能 收发 自 定 义 类 型 的 数据 帧 ， 在 后 面 的 例子 中 可 以 看 到 。 注 意 传 入 参数 时 
需要 用 htons 进行 字 节 序 转换 ， 比 如 htons CETH_P_ALL) 。 如 果 函 数 执行 成 功 ， 就 返回 一 个 正 整 
数 ， 表 示 链 路 层 的 套 接 字 ; 失败 则 返回 -1， 可 以 通过 errno 查看 错误 码 。 

15.4.2 ”接收 函数 recvfrom 
原始 套 接 字 的 数据 接收 同 UDP 的 收发 数据 函数 ， 声 明 如 下 : 





#include <sys/types.h> 

#include <sys/socket.h> 

ssize t recvfrom(int sock, void *buf, size t len, int flags, struct sockaddr 
*from, socklen t *fromlen); 


其 中 ， 参 数 sock 是 将 要 从 其 接收 数据 的 套 接 字 ;buf 为 存放 消息 接收 后 的 缓冲 区 ，len 为 buf 
所 指 缓冲 区 的 大 小 ; from. 是 一 个 输出 参数 〈 记 住 这 一 点 ， 不 是 用 来 指定 接收 来 源 ， 如 果 要 指定 接 
收 来 源 ， 要 用 bind 函数 进行 套 接 字 和 物理 层 的 地 址 绑 定 ) ， 该 参数 用 来 获取 对 端 地 址 ， 所 以 from 
指向 已 经 开辟 好 的 缓冲 区 ， 如 果 不 需要 获得 对 端 地 址 ， 就 设 为 NULL， 即 不 存储 对 端 地 址 。 开 始 笔 
者 以 为 from 是 一 个 输入 参数 ， 用 来 指定 接收 数据 的 网 络 接口 ， 后 来 通过 很 多 实践 发 现 并 不 是 这 么 
回 事 ， 而 很 多 Linux 文献 ， 包 括 man 帮助 都 没有 说 明 它 是 输出 参数 ， 幸 亏 最 后 在 微软 的 文献 上 找 
到 了 证 明 ， 大 家 可 以 看 一 下 微软 对 该 函数 的 定义 : 
int 
WSAAPI 
recvfrom( 
In SOCKET s, 
.Out writes bytes to (len, return) out data source(NETWORK) char FAR * 


buf, 
.In int len, 


.In int flags, 
Out writes bytes to opt (*fromlen, *fromlen) struct sockaddr FAR * from, 
.Inout opt int FAR * fromlen 


); 


大 家 可 以 看 到 _Out_ writes bytes to opt ,这 就 说 明 from 是 一 个 输出 参数 , 后 来 通过 反复 实验 ， 
证 明 它 的 确 是 输出 参数 ， 用 来 获取 接收 数据 的 来 源 socket 地 址 ， 虽 然 参 数 类 型 是 sockaddr 指针 ， 
但 传 入 的 实 参 需要 一 个 物理 层 地址 , 即 结构 体 sockaddr 1 我们 后 面 在 发 送 函数 的 时 候 会 详细 阐述 
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这 个 结构 体 。fromlen 是 一 个 指针 ， 而 且 是 一 个 输入 输出 参数 ， 作 为 输入 参数 时 ， 指 向 存放 表示 from 
所 指 缓冲 区 的 最 大 长 度 ， 作 为 输出 参数 时 ， 指 向 存放 表示 from 所 指 缓冲 区 的 实际 长 度 ，from 也 可 以 
取 NULL， 就 是 不 存储 来 源 地 址 ， 此 时 fromlen 也 要 设 为 0。 函数 成 功 执行 时 ， 返 回 接收 到 的 字 节 数 ; 
另 一 端 已 关闭 则 返回 0; 失败 则 返回 -1， 可 以 用 errno 获取 错误 码 ，ermo 被 设 为 以 下 的 某 个 值 。 


€ EAGAN: 套 接 字 已 标记 为 非 阻 塞 ， 而 接收 操作 被 阻塞 或 者 接收 超时 。 
€ EBADF: sock 不 是 有 效 的 描述 词 。 

@ ECONNREFUSE: 远程 主机 阻 绝 网 络 连接 。 

€ EFAULT: 内 存 空 间 访问 出 错 。 

€ EINTR: 操作 被 信号 中 断 。 

€ EINVAL: 参数 无 效 。 

€ ENOMEM: 内 存 不足 。 

€ ENOTCONN: 与 面向 连接 关联 的 套 接 字 尚未 被 连接 上 。 

€  ENOTSOCK: sock 索引 的 不 是 套 接 字 。 

该 函数 使 用 时 和 UDP 基本 相同 ， 只 不 过 套 接 字 用 的 是 原始 套 接 字 。 另 外 ， 如 果 要 获取 来 源 地 
可 以 这 样 使 用 : 


E 


struct sockaddr 11 sa recvi 
recvfrom(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa recv, &sa len); 


值得 注意 的 是 ， 默认 情况 下 ， 从 任何 接口 收 到 的 符合 指定 协议 (包括 自 定义 协议 号 ) 的 所 有 数 
据 报 文 都 会 被 传送 到 原始 PACKET 套 接 字 口 ， 而 使 用 bind 系统 调用 并 以 一 个 sochddr 11 结构 体 对 
象 将 PACKET 套 接 字 与 某 个 网 络 接口 相 绑 定 , 就 可 以 使 我 们 的 PACKET 原始 套 接 字 只 接收 指定 接 
口 的 数据 报 文 。 大 家 可 以 从 后 面 的 实例 中 深 深 体会 到 这 一 点 。 


15.4.8 £Z Až sendto 


同 UDP 的 发 送 函数 ， 原 始 套 接 字 的 数据 发 送 也 是 用 sendto。 需 要 格外 留心 的 一 点 是 ， 发 送 数 
据 的 时 候 需 要 自己 组 织 整个 以 太 网 数据 帧 。 和 地 址 相关 的 结构 体 就 不 能 再 用 前 面 的 struct 
sockaddr in 了 ， 而 是 用 struct sockaddr 11， 使 用 的 时 候 这 样 : 


struct sockaddr 11 sa; 
// 对 sa 设置 相关 内 容 
sendto(fd, buf, sizeof (buf), 0, (struct sockaddr *)&sa, sizeof (struct 
sockaddr_11)); 


sockaddr 1l 结构 体 地 址 表示 的 是 一 个 与 物理 设备 无 关 的 物理 层 地 址 ， 定 义 如 下 : 


struct sockaddr 11 ( 
unsigned short sll family; 
. bel6 S1l protocol; 
int sll ifindex; 
unsigned short sll hatype; 
unsigned char  sll pkttype; 
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unsigned char  sll halen; 
unsigned char  sll addr[8]; 
11 


其 中 ， 参 数 slL family E sockaddr in 中 的 sa family 一 样 ， 表 示 地 址 簇 的 意思 。sll_protocol 表 
示 上 层 的 协议 类 型 ， 通 常 有 如 下 取 值 : 


// 定义 在 头 文件 «linux/if ether.h> 

/* 

* These are the defined Ethernet Protocol ID's. 
iy 


#define ETH P LOOP 0x0060 /* Ethernet Loopback packet */ 
#define ETH P PUP 0x0200 /* Xerox PUP packet */ 

#define ETH P PUPAT 0x0201 /* Xerox PUP Addr Trans packet */ 
#define ETH P IP 0x0800 /* Internet Protocol packet */ 
#define ETH P X25 0x0805 /* CCITT X.25 */ 

#define ETH P ARP 0x0806 /* Address Resolution packet */ 
#define ETH P BPQ Ox08FF /* G8BPQ AX.25 Ethernet Packet*/ 
#define ETH P IEEEPUP 0x0a00 /* Xerox IEEE802.3 PUP packet */ 
#define ETH P IEEEPUPAT 0x0a01 /* Xerox IEEE802.3 PUP Addr Trans packet */ 
#define ETH P DEC 0x6000 /* DEC Assigned proto */ 

#define ETH P DNA DL 0x6001 /* DEC DNA Dump/Load */ 

$define ETH P DNA RC 0x6002 /* DEC DNA Remote Console */ 
$define ETH P DNA RT 0x6003 /* DEC DNA Routing */ 

$define ETH P LAT 0x6004 /* DEC LAT */ 

#define ETH P DIAG 0x6005 /* DEC Diagnostics */ 

#define ETH P CUST 0x6006 /* DEC Customer use */ 

#define ETH P SCA 0x6007 /* DEC Systems Comms Arch */ 
#define ETH P RARP 0x8035 /* Reverse Addr Res packet */ 
$define ETH P ATALK 0x809B /* Appletalk DDP */ 

#define ETH P AARP Ox80F3 /* Appletalk AARP */ 

#define ETH P IPX 0x8137 /* IPX over DIX */ 

#define ETH P IPV6 Ox86DD /* IPv6 over bluebook */ 

#define ETH P PPP DISC 0x8863 /* PPPoE discovery messages */ 
#define ETH P PPP SES 0x8864 /* PPPoE session messages */ 
#define ETH P ATMMPOA 0x884c /* MultiProtocol Over RTM */ 
#define ETH P ATMFATE 0x8884 /* Frame-based ATM Transport 

* over Ethernet 

n 


sll_ifindex 表示 网 络 接口 类 型 ， 如 果 是 单 网 卡 主机 ， 可 以 赋值 为 0， 置 为 0 表示 处 理 所 有 接口 ， 
对 于 多 网 卡 ， 则 要 获取 网 卡 的 接口 索引 ， 然 后 赋值 给 这 个 参数 ， 比 如 : 


struct sockaddr ll sll; 

struct ifreq ifr; 

strcpy(ifr.ifr name, "eth0"); 

ioctl(sockfd, SIOCGIFINDEX, &ifr); 

sll.sll ifindex = ifr.ifr ifindex; // 网 卡 的 接口 索引 ， 然 后 赋值 给 这 个 参数 
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通常 还 有 如 下 已 知 类 型 可 以 直接 赋值 : 


// 定 义 在 <linux/netdevice.h> 
/* Media selection options. */ 


enum { 


IF PORT UNKNOWN = 0, 
IF PORT 10BASE2, 

IF PORT 10BASET, 

IF PORT AUI, 

IF PORT 100BASET, 

IF PORT 100BASETX, 
IF PORT 100BASEFX 


NH 


sll hatype 为 ARP 硬件 地 址 类 型 ， 可 以 选择 : 


// 定 义 在 <net/if_arp.h> 
/* ARP protocol HARDWARE identifiers. */ 


#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 


ARPHRD NETROM 0 /* From KA9Q: NET/ROM pseudo. */ 
ARPHRD ETHER 1 /* Ethernet 10/100Mbps. */ 

ARPHRD EETHER 2 /* Experimental Ethernet. */ 
ARPHRD AX25 3 /* AX.25 Level 2. */ 

ARPHRD PRONET 4 /* PROnet token ring. */ 

ARPHRD CHAOS 5 /* Chaosnet. */ 

ARPHRD IEEE802 6 /* IEEE 802.2 Ethernet/TR/TB. */ 
ARPHRD ARCNET 7 /* ARCnet. */ 

ARPHRD APPLETLK 8 /* APPLEtalk. */ 

ARPHRD DLCI 15 /* Frame Relay DLCI. */ 

ARPHRD ATM 19 /* ATM. */ 

ARPHRD METRICOM 23 /* Metricom STRIP (new IANA id). */ 


sll pkttype 包含 分 组 类 型 ， 有 效 的 分 组 类 型 如 下 。 


PACKET_HOST: 目标 地 址 是 本 地 主机 的 分 组 用 的 。 

PACKET_BROADCAST: 物理 层 广 播 分 组 用 的 。 

PACKET_MULTICAST: 发 送 到 一 个 物理 层 多 路 广播 地 址 的 分 组 用 的 。 

PACKET OTHERHOST: 在 混杂 (promiscuous ) 模式 下 的 设备 驱动 器 发 向 其 他 主机 


的 分 组 用 的 。 
€ PACKET OUTGOING: 本 源 于 本 地 主机 的 分 组 被 环 回 到 分 组 套 接口 用 的 。 


这 些 类 型 只 对 接收 到 的 分 组 有 意义 。 
sll addr 和 sll halen 为 物理 层 〈 例 如 IEEE 802.3) 地 址 〈 比 如 MAC 地 址 ) 和 地 址 长 度 ， 精 
确 的 解释 依赖 于 设备 。 


sll_halen 


为 MAC 地 址 长 度 (6bytes) ， 通 常 取 值 如 下 : 


// 定 义 在 头 文件 <linux/if ether.h» 


#define 


ETH_ALEN 6 /* Octets in one ethernet addr */ 
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#define ETH HLEN 14 /* Total octets in header. */ 

#define ETH ZLEN 60 /* Min. octets in frame sans FCS */ 

fdefine ETH DATA LEN 1500 /* Max. octets in payload */ 

(define ETH FRAME LEN 1514 /* Max. octets in frame sans FCS */ 

sll addr[8] 表示 MAC 地 址 ,如 果 sockaddr. 11 用 在 recvfrom 中 ,那么 得 到 的 是 数据 源 端的 MAC 
地 址 。 如 果 要 绑 定 sockaddr 11 到 套 接 字 ， 则 这 个 字段 设置 要 绑 定 网 卡 的 MAC 地 址 。 


15.5 “以太 网 帧 格式 


因为 下 面 有 例子 涉及 以 太 网 格式 ， 所 以 这 里 简要 分 析 一 下 。 

以 太 网 帧 格式 即 在 以 太 网 帧 头 、 帧 尾 中 用 于 实现 以 太 网 功能 的 域 。 在 以 太 网 的 帧 头 和 帧 尾 中 
有 几 个 用 于 实现 以 太 网 功能 的 域 ， 每 个 域 也 称 为 字段 ， 有 其 特定 的 名 称 和 目的 。 以 太 网 帧 格式 多 达 
5 种 ， 这 是 由 历史 原因 造成 的 。 那 么 实际 使 用 中 具体 会 用 哪 种 呢 ? 事实 上 ， 如 今 大 多 数 TCP/P 应 
用 都 是 用 Ethernet V2 帧 格式 (IEEE802.3-1997) 的 。RFC894 规定 了 这 种 以 太 网 的 封装 格式 ， 如 图 
15-2 所 示 。 


目的 MAC 地 址 字段 | |3 
源 MAC 地 址 字段 








Ls 回回 2a 





图 15-2 


e 前 同步 码 : 前 7 字 节 都 是 10101010， 最 后 一 个 字 节 是 10101011。 用 于 将 发 送 方 与 接 
收 方 的 时 钟 进行 同步 ， 主要 是 由 不 同类 型 的 以 太 网 同时 发 送 接收 速率 也 不 完全 精确 的 
帧 速率 传输 ， 因 此 需要 在 传输 之 前 进行 时 钟 同步 。 

€ 目的 MAC 地 址 字段 都 是 6 字 节 共 128 位 的 MAC 物理 地 址 ,用 于 标识 帧 的 接收 者 ， 
可 以 是 某 个 机 器 的 物理 地 址 ， 也 可 以 是 FF-FF-FF-FF-FF-FF 广播 MAC 地 址 。 

© Ñ MAC 地 址 字段 : 用 于 标识 帧 的 发 送 者 。 

e ”类 型 字段 : 帧 中 数据 的 协议 类 型 ， 比 如 数据 部 分 是 呈报 文 ， 这 里 就 是 0x0800; wR 
是 ARP 报 文 ， 就 是 0x0806。 

@ ”数据 字段 : 高 层 的 数据 ， 通 常 为 3 层 ( 网 络 层 ) 协议 数据 单元 ， 比 如 存放 IP 报 文 、 
ARP 报 文 、RARP 报 文 ， 如 图 15-3 所 示 。 
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图 15-3 


€ CRC: 循环 宛 余 校 验 ， 用 来 让 接收 方 的 网 卡 适 配器 检查 接收 到 的 数据 帧 是 否 有 错误 ， 
是 否 有 比特 翻转 引入 差错 ， 如 果 引 入 了 差错 就 会 丢弃 ， 这 是 网 卡 适 配器 直接 从 硬件 响 
应 的 . 此 字段 是 发 送 方 发 送 时 由 适配器 从 该 帧 中 除了 前 同步 码 之 外 的 其 他 比特 进行 映 
射 计 算 获得 的 。 

通常 以 太 帧 的 长 度 指 的 是 从 目的 地 址 到 宛 余 校 验 。 在 802.3 标准 里 ， 定 义 帧 最 大 为 1518 字 节 ， 
规定 一 个 以 太 帧 的 数据 部 分 (Payload) 的 最 大 长 度 是 1500 字 节 ， 这 个 数 也 是 经 常 在 网 络 设备 里 看 
到 的 MTU。 在 这 个 限制 之 下 ， 最 长 的 以 太 帧 包括 6 字 节 的 目的 地 址 (MAC) ~ 6 字 节 的 源 地 址 

(SMAC) 、2 字 节 的 以 太 类 型 (EtherType) 、1500 字 节 的 载荷 数据 (Payload) 、4 字 节 的 校 验 
(FCS), 总 共 是 1518 字 节 。 IEEE802.3 定义 最 小 64 字 节 , 如 果 帧 长 小 于 64 字 节 , 则 要 求 “ 填 充 ”， 
以 使 这 个 帧 的 长 度 达到 64 字 节 。 

上 面 介 绍 的 基本 都 是 在 十 兆 / 百 兆 以 太 网 的 年 代 ， 但 到 了 千 兆 以 太 网 出 现 以 后 ， 发 现 如 果 
payload 被 限制 在 1500 字 节 ， 传 输 效 率 不 够 高 ， 所 以 又 提出 了 Jumbo Frame《〈 巨 帧 ) 的 概念 。 在 一 
个 Jumbo Frame 中 ，Payload 的 长 度 是 可 以 超过 1500 字 节 的 ， 通 常 来 说 最 高 可 以 到 9000 字 节 ， 但 
并 没有 一 个 统一 的 标准 。 就 目前 来 看 ， 大 部 分 商用 的 网 络 服务 提供 商都 还 不 支持 Jumbo Frame. 

目的 、 源 MAC 地 址 和 类 型 构成 以 太 网 帧 头 ， 在 Linux 系统 中 ， 使 用 struct ethhdr 结构 体 来 表 
示 以 太 网 帧 的 头 部 。 这 个 struct ethhdr 结构 体位 于 ##nclude<linux/if_ether.h> 中 ， 定 义 如 下 : 

$define ETH ALEN 6 // 定 义 了 以 太 网 接口 的 MAc 地 址 的 长 度 为 6 字 节 

#define ETH HLAN 14 // 定 义 了 以 太 网 帧 的 头 长 度 为 14 字 节 

$define ETH ZLEN 60 // 定 义 了 以 太 网 帧 的 最 小 长 度 为 ETH_ZLEN+ETH _FCS_LEN=64 字 节 

#define ETH DATA LEN 1500 // 定 义 了 以 太 网 帧 的 最 大 负载 为 1500 字 节 

#define ETH FRAME LEN 1514 // 定 义 了 以 太 网 帧 的 最 大 长 度 为 ETH DATA LEN+ETH FCS LEN-1518 
字 节 

$define ETH FCS LEN 4 // 定 义 了 以 太 网 帧 的 CRC 值 占 4 字 节 


struct ethhdr 
t 
unsigned char h dest[ETH ALEN]; // 目 的 MAC 地 址 
unsigned char h source[ETH ALEN]; // 源 MAC 地 址 
ul6 h proto ; // 网 络 层 所 使 用 的 协议 类 型 
) attribute ((packed)) // 用 于 告诉 编译 器 不 要 对 这 个 结构 体 中 的 缝隙 部 分 进行 填充 操作 














原始 套 接 字 编程 第 15 党 





15.6 ”获取 网 络 接口 的 信息 


在 Linux 下 ， 可 以 使 用 ioctl 函数 、struct ifreq 结构 体 和 struct ifconf 结构 体 来 获取 网 络 接口 的 
各 种 信息 。 首 先 来 看 ioctl0 的 用 法 ， 该 函数 在 Linux 驱动 编程 中 经 常 碰 到 ， 用 于 用 户 层 和 驱动 层 交 
换 信 息 ， 以 达到 控制 设备 功能 的 目的 。 函 数 ioctl 声明 如 下 : 

#include <sys/ioctl.h> 

int ioctl (int d, int request, ...); 

其 中 ， 参 数 d 为 文件 描述 符 或 套 接 字 描述 符 ，request 表示 要 请 求 的 信息 ， 如 IP 地 址 、 网 络 掩 
码 等 ;... 表 示 后 面 的 可 变 参 数 根据 request 而 定 。 如 果 函 数 执行 成 功 ， 通 常 返回 0 但 也 有 一 些 情况 
会 返回 一 个 非 负 整数 ， 如 果 函 数 执行 失败 则 返回 -1， 此 时 可 用 erno 查看 错误 码 。 

这 里 关心 的 是 与 网 络 接口 相关 的 信息 ， 此 时 request 的 取 值 如 表 15-1 所 示 。 


表 15-1 request 的 取 值 












































类 别 request 说 明 输出 参数 类 型 (ioctl 中 的 可 变 参数 ) 
sen |SIOCATMARK — [RsermMG O OO Je | 
SIOCSPGRP 设置 套 接口 的 进程 ID 或 进程 组 ID |int č č | 
SIOCGPGRP 获取 套 接口 的 进程 ID 或 进程 组 ID |int O 
文件 — | FIONBIN 设置/ 清除 非 阻塞 VO 标志 C 
FIOASYNC 设置/ 清除 信号 驱动 异步 WO 标志 |int O 
FIONREAD 获取 接收 缓存 区 中 的 字 节 数 C 
FIOSETOWN 设置 文件 的 进程 ID 或 进程 组 D |int 
FIOGETOWN 获取 文件 的 进程 ID 或 进程 组 ID Jim || 
SIOCSIFADDR 设置 接口 地 址 struct ifreq 
SIOCGIFADDR 获取 接口 地 址 struct ifreq 
SIOCSIFFLAGS 设置 接口 标志 struct ifreq 
SIOCGIFFLAGS 获取 接口 标志 struct ifreq 
SIOCSIFDSTADDR | 设置 点 到 点 地 址 struct ifreq 
SIOCGIFDSTADDR | 获取 点 到 点 地 址 struct ifreq 
SIOCGIFBRDADDR | 获取 广播 地 址 struct ifreq 
SIOCSIFBRDADDR 设置 广播 地 址 struct ifreq 
SIOCGIFNETMASK | 获取 子 网 掩 码 struct ifreq 
SIOCSIFNETMASK 设置 子 网 掩 码 struct ifreq 
SIOCGIFMETRIC 获取 接口 的 测度 struct ifreq 
SIOCGIFMETRIC 获取 接口 的 测度 struct ifreq 











SIOCSIFMETRIC 设置 接口 的 测度 struct ifreq 
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( 续 表 ) 





EJ request 


接口 SIOCGIFMTU 


说 明 输出 参数 类 型 Cioctl 中 的 可 变 参数 ) 
获取 接口 MTU struct ifreq 





ARP SIOCSARP 


| 创建 /修改 ARP 表 项 struct arpreq 





SIOCGARP 
SIOCDARP 


获取 ARP 表 项 struct arpreq 
删除 ARP 表 项 struct arpreq 





路 由 SIOCADDRT 


增加 路 径 struct rtentry 








SIOCDELRT 





删除 路 径 struct rtentry 


比如 我 们 要 求 所 有 网 络 接口 的 清单 ， 可 以 这 样 : 
struct ifconf IoCtlReq; 


ioctl( Sock, SIOCGIFCONF, &IoCtlReq ) 


其 中 ， 结 构 体 IoCtlReq 用 来 存放 结果 信息 。 网 络 接口 请 求 结 构 体 struct ifreq 定义 在 
/usr/include/net/if.h 中 ， 用 来 配置 和 获取 IP 地 址 、 掩 码 、MTU 等 接口 信息 ， 该 结构 体 定义 如 下 : 


struct ifreq 
{ 
# define IFHWADDRLEN 6 
# define IFNAMSIZ IF NAMESIZE 
union 
{ 
char ifrn name[IFNAMSIZ]; /* Interface name, e.g. "en0". */ 
IE Eteoitrn; 


union 

{ 
struct sockaddr ifru addr; 
struct sockaddr ifru dstaddr; 
struct sockaddr ifru broadaddr; 
struct sockaddr ifru netmask; 
struct sockaddr ifru hwaddr; 
short int ifru_flags; 
int ifru ivalue; 
int ifru mtu; 
struct ifmap ifru map; 
char ifru slave[IFNAMSIZ]; /* Just fits the size */ 
char ifru newname[IFNAMSIZ]; 
. caddr t ifru data; 

y ifr rfrus 

}; 


里 面包 含 两 个 联合 体 ， 一 个 是 网 络 接口 名 ， 另 一 个 是 各 种 信息 。 要 获取 某 个 网 络 接口 的 信息 ， 
一 般 要 先 把 该 网 络 接口 的 名 字 赋 值 给 ifm_name， 然 后 调用 ioctl 来 获取 所 需要 的 信息 。 
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下 面 的 例子 演示 如 何 获取 网 卡 的 MAC 地 址 信息 。 
【 例 15.1】 获 取 网 卡 的 MAC 地 址 


CD 打开 UE， 输 入 代码 如 下 : 


#include «sys/ioctl.h» 

#include <net/if.h> 

#include <linux/if ether.h> 
#include <bits/ioctls.h> 
#include <linux/if packet.h> 
#include <net/ethernet.h> 
#include <errno.h> 

#include <string.h> //bzero 
#include <sys/types.h> 

#include <sys/socket.h> 
#include «unistd.h» //for close 
#include «arpa/inet.h»//htons 
#include <stdio.h> 

#include <stdlib.h>//EXIT_FAILURE 
#define IFRNAME "eno16777736" 


unsigned char dest mac[6] = { 0 }; 


int main(int argc, char **argv) 


t 


int i, datalen; 
int sd; 


struct sockaddr 11 device; 


struct ifreq ifr; // 定 义 网 口 的 信息 请 求 结构 体 


bzero(&ifr, sizeof(struct ifreq)); 


if ((sd = socket(PF PACKET, SOCK DGRAM, htons(ETH P ALL))) < 0) 


// 创 建 原始 套 接 字 
t 


printf("socket() failed to get socket descriptor for using ioctl()"); 


return (EXIT FAILURE); 

) 

memcpy(ifr.ifr name, IFRNAME, sizeof(struct ifreq)); 

if (ioctl(sd, SIOCGIFHWADDR, &ifr) < 0) ( // 发 送 请 求 
printf("ioctl() failed to get source MAC address"); 
return (EXIT FAILURE); 

} 

close (sd); 


memcpy (dest_mac, ifr.ifr_hwaddr.sa_data, 6); 


printf ("mac addr:%02x:%02x:%02x:%02x:%02x:%02x\n", dest mac[0], 
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dest mac[1], dest mac[2], dest mac[3], dest mac[4], dest mac[5]); // 打 印 MAC 地 址 
return 0; 


) 

我 们 首先 创建 了 一 个 链 路 层 的 原始 套 接 字 , 然后 把 网 卡 名 字 复 制 给 ifrifr name, 接着 调用 ioctl 
函数 获取 SIOCGIFHWADDR 指定 的 信息 ， 即 网 卡 的 MAC 地 址 。 因 为 这 里 创建 的 套 接 字 是 链 路 层 
套 接 字 ， 所 以 通过 SIOCGIFHWADDR 获得 的 地 址 是 MAC 地 址 。 如 果 要 获取 网 卡 的 IP 地 址 ， 就 
要 创建 面向 TP 层 的 原始 套 接 字 ， 后 面 会 讲 到 。 


(2) 保存 为 test.cpp， 然 后 上 传 到 Linux， 编 译 并 运行 





[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
mac addr:00:0c:29:3d:94:13 


该 MAC 地 址 是 笔者 网 卡 eno16777736 的 MAC 地址， 大 家 可 以 用 ifconfig 命令 对 比 一 下 。 
15.7 ”实战 链 路 层 的 原始 套 接 字 


15.7.1 常见 的 应 用 场景 

下 面 来 看 一 些 链 路 层 的 原始 套 接 字 常 见 的 应 用 场景 。 
【 例 15.2】 抓 包 并 判断 网 络 层 包 类 型 

(1) 准备 两 台 虚 拟 机 A MB, MRA CentOS 7， 其 中 : 


€ 主机 A 的 IP 为 172.16.2.6，MAC 为 00:0c:29:6c:0d:c2. 
© 主机 B 的 IP 为 172.16.2.9，MAC 为 00:0c:29:8f:f6:4c。 


做 到 能 互相 ping 通 。 现 在 我 们 的 程序 在 主机 A 上 进行 抓 包 , 在 B 上 向 A 发 送 一 些 包 , 然后 看 
A 能 否 收 到 并 判断 出 来 。 


(2) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <string.h> 
#include <stdlib.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include «arpa/inet.h» 
#include <netinet/ether.h> 


int main(int argc,char *argv[]) 
t 

int i = 0; 

unsigned char buf[1024] = ""; 
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int sock raw fd = socket (PF PACKET, SOCK RAW, htons(ETH P ALL)); 
while(1) 
t 
char src mac[18] - 
char dst mac[18] - ; 





recvfrom(sock raw fd, buf, sizeof (buf), 0, NULL, NULL) ;// 获 取 链 路 层 的 数据 帧 
// 从 buf 里 提取 目的 mac、 源 mac 
sprintf(dst mac,"$02x:$02x:$02x:$02x:$02x:$02x", buf[0], buf[1], 
buf[2], buf[3], bu£[4], buf[5]); 
sprintf(src mac,"$02x:$02x:$02x:$02x:$902x:$02x", buf[6], buf[7], 
buf[8], buf[9], buf[10], buf[11]); 
if(buf[12]--0x08 && buf[13]--0x00)  // 判 断 是 否 为 TP 数 据 报 
{ 
printf(" IP 数 据 报 in"); 
printf("MAC:$s >> $sWMn",src mac,dst mac); 





) 
else if(buf[12]--0x08 && buf[13]--0x06) // 判 断 是 否 为 ARP 数 据 报 
{ 
printf(" RRP 数 据 报 Nnm 
printf("MAC:$s >> $sWn",src mac,dst mac); 





) 
else if(buf[12]--0x80 && buf[13]--0x35) // 判 断 是 否 为 RARP 数 据 报 
{ 
printf(" RARP 数 据 报 NATIS, 
printf ("MAC:%s>>%s\n", src mac,dst mac); 





} 
} 


return 0; 


l 
(3) 上 传 到 主机 A， 然 后 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 


如 果 此 时 SecureCRT 正 连 着 主机 A，test 程序 就 会 收 到 很 多 IP 数据 包 。 为 了 方便 观察 ， 我 们 
可 以 把 代码 中 判断 IP 数 据 包 的 那 一 段 ff 注释 掉 ， 再 编译 运行 test。 
(4) 捕获 ARP 包 。 
TE B 端 发 送 5 个 ARP RWE, E B 端 命令 行 输入 arping 命令 : 


[root@localhost ~]# arping -I eno16777736 172.16.2.6 -c 5 
ARPING 172.16.2.6 from 172.16.2.9 eno16777736 


Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 1.030ms 
Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 2.205ms 
Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 1.029ms 
Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 1.024ms 
Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 1.043ms 
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Sent 5 probes (1 broadcast(s)) 
Received 5 response (s) 
[rootelocalhost -]4 


可 以 看 到 ，B 发 送 了 5 个 探测 包 〈 其 中 有 一 个 是 广播 包 ) ， 并 收 到 了 5 个 响应 包 。 我 们 再 看 A 端 : 


[rootQlocalhost test]# ./test 
ARP 

MAGHOO0S0C:29*8Ff:POorACETOERRUDfoRENSEESBRUER 
ARP 

MAC:00:0c:29:6c:0d:c2 >> 00:0c:29:8£:£6:4c 
ARP 

MAC:00:0c:29:8£:£6:4c »» 00:0c:29:6c:0d:c2 
ARP 

MAC:00:0c:29:6c:0d:c2 >> 00:0c:29:8£:£6:4c 
ARP 

MAC:00:0c:29:8£:£6:4c >> 00:0c:29:6c:0d:c2 
ARP 

MAC:00:0c:29:6c:0d:c2 >> 00:0c:29:8£:£6:4c 
ARP 

MAC:00:0c:29:8£:£6:4c >> 00:0c:29:6c:0d:c2 
ARP 

MAC:00:0c:29:6c:0d:c2 >> 00:0c:29:8£:£6:4c 
ARP 

MAC:00:0c:29:8£:£6:4c >> 00:0c:29:6c:0d:c2 
ARP 

MAC:00:0c:29:6c:0d:c2 >> 00:0c:29:8£:£6:4c 


可 以 发 现在 A 端 ，test 程序 捕获 了 10 个 ARP 包 ， 而 且 第 一 个 包 是 一 个 广播 包 〈 目 的 地 址 是 
FEFEFEFEEFE) 。 

第 一 个 抓 到 的 包 的 源 MAC 地 址 是 00:0c:29:8f:f6:4c， 目的 地 址 是 fEFEFEFEIEE, 说 明 是 从 B 端 
发 出 来 的 ARP 广播 包 。 

第 二 个 抓 到 的 包 的 源 MAC 地 址 是 00:0c:29:6c:0d:c2， 目 的 地 址 是 00:0c:29:8f:f6:4c， 说 明 是 从 
A 端 发 出 的 ARP 包 ， 而 且 是 发 给 B 的 ， 也 就 是 A 端 对 B 端 第 一 个 包 的 响应 。 

第 三 个 抓 到 的 包 的 源 MAC 是 00:0c:29:8f:f6:4c， 目 的 地 址 是 00:0c:29:6c:0d:c2， 说 明 该 ARP 
包 是 B 端 发 出 的 ， 而 且 是 发 给 A 的 ， 这 个 包 是 我 们 在 B 端 通过 arping 命令 发 出 来 的 第 二 个 包 。 

第 四 个 抓 到 的 包 的 源 MAC 是 00:0c:29:6c:0d:c2， 目 的 地 址 是 00:0c:29:8ff6:4c， 说 明 该 ARP 
包 是 从 A 端 发 出 的 ， 而 且 是 发 给 B 的 。 这 个 包 是 A 收 到 了 第 三 个 包 后 ， 对 其 做 出 的 响应 。 

后 面 的 包 都 是 如 此 ， 一 问 一 答 ，test 把 10 个 ARP 包 都 抓 到 了 。 

上 面 的 例子 还 要 自己 去 判断 数据 包 类 型 ， 其 实 我 们 创建 套 接 字 的 时 候 ， 可 以 直接 指定 类 型 ， 
这 样 可 以 直接 收 到 所 需 类 型 的 数据 包 ， 比 如 ARP 报 文 。 


【 例 15.3】 直 接 抓 取 ARP 报 文 
CD 准备 两 台 虚 拟 机 A 和 B， 都 装 有 CentOS 7， 其 中 : 


























€ iX. A LIP X 172.16.2.6. MAC 为 00:0c:29:6c:0d:c2。 
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€ 主机 B 的 卫 为 172.16.2.9，MAC 为 00:0c:29:8ff6:4c。 


做 到 能 互相 ping 通 。 现 在 我 们 的 程序 在 主机 A 上 进行 抓 包 , 在 B 上 向 A 发 送 一 些 包 , 然后 看 
A 能 否 收 到 并 判断 出 来 。 


(2) 打开 UE， 输 入 代码 如 下 : 


#include <stdlib.h> 
#include <sys/socket.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <netinet/ether.h> 
#include <netinet/if ether.h> //for ethhdr 
#include «arpa/inet.h» 
int main(int argc, char *argv []) 
t 
int i = 03 
unsigned char buf[1024] = ""; 
struct ethhdr *eth; // 定 义 以 太 网 头 结构 体 指针 
int sock raw fd = socket (PF PACKET, SOCK RAW, htons(ETH P ARP)); 
while (1) 
t 
recvfrom(sock raw fd, buf, sizeof(buf), 0, NULL, NULL);//3kBUERE 
数据 帧 
eth = (struct ethhdr*)buf; 
// 从 eth 里 提取 目的 mac、 源 mac、 协 议 号 
printf("proto-0x$04x,dst mac addr:%02x:%02x:%02x:%02x:%02x:%02x\n", 
ntohs(eth-»h proto), eth->h dest[0], eth->h dest[1], eth->h dest[2], 
eth-»h dest[3], eth->h dest[4], eth-»h dest[5]); 
printf("proto-0x$04x,src mac addr:$02x:$02x:$02x:$02x:9$02x:9$02xWn", 
ntohs(eth-»h proto), eth->h source[0], eth-»h source[1], eth-»h source[2], 
eth-»h source[3], eth-»h source[4], eth->h source[5]); 
) 
return 0; 


) 


在 代码 中 , 我 们 定义 套 接 字 的 时 候 使 用 了 ETH. P. ARP 协议 号 , 这样 这 个 套 接 字 就 只 会 去 接收 
ARP 报 文 了 。 然 后 ， 我 们 定义 了 以 太 网 头 结构 体 指针 ， 用 这 个 指针 指向 接收 到 的 数据 缓冲 区 ， 就 
能 通过 结构 体 字段 来 得 到 目的 、 源 MAC 地 址 和 协议 号 。 

G) 上 传 到 主机 A， 然 后 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 


如 果 此 时 SecureCRT 正 连 着 主机 A, test 程序 就 会 收 到 很 多 IP 数据 包 。 为 了 方便 观察 ， 我 们 
可 以 把 代码 中 判断 卫 数据 包 的 那 一 段 ff 注释 掉 ， 再 编译 运行 test。 
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(4) 捕获 ARP 包 。 
TE B 端 发 送 5 个 ARP 探测 包 ， 在 B 端 命令 行 输入 arping 命令 : 


[root@localhost ~]# arping -I eno16777736 172.16.2.6 -c 5 
ARPING 172.16.2.6 from 172.16.2.9 eno16777736 

Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 1.030ms 
Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 2.205ms 
Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 1.029ms 
Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 1.024ms 
Unicast reply from 172.16.2.6 [00:0C:29:6C:0D:C2] 1.043ms 
Sent 5 probes (1 broadcast (s)) 

Received 5 response (s) 

[rootelocalhost -]4 


可 以 看 到 ，B 发 送 了 5 个 探测 包 (其 中 有 一 个 是 广播 包 ) ， 并 收 到 了 5 个 响应 包 。 我 们 再 看 A 端 ; 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 

proto-0x0806,dst mac addr:ff:ff:ff:ff:ff:ff 
proto-0x0806,src mac addr:00:0c:29:8£:£6:4c 
proto-0x0806,dst mac addr:00:0c:29:6c:0d:c2 
proto-0x0806,src mac addr:00:0c:29:8£:£6:4c 
proto-0x0806,dst mac addr:00:0c:29:6c:0d:c2 
proto-0x0806,src mac addr:00:0c:29:8f:f6:4c 
proto-0x0806,dst mac addr:00:0c:29:6c:0d:c2 
proto-0x0806,src mac addr:00:0c:29:8f:f6:4c 
proto-0x0806,dst mac addr:00:0c:29:6c:0d:c2 
proto-0x0806,src mac addr:00:0c:29:8£:£6:4c 


可 见 ，A 端 捕获 到 了 10 个 ARP 报 文 ， 为 什么 是 10 个 报 文 就 不 介绍 了 ， 有 具体 可 以 参考 上 例 。 


【 例 15.4】 直 接 抓 取 IP 报 文 ， 并 打印 IP 地 址 
(1) 准备 一 台 装 有 CentOS 7 的 虚拟 机 A， 另 一 台 是 装 有 Windows 7 的 主机 ， 其 中 : 


€ 主机 A 的 IP 为 1.1.1.10，MAC 地 址 为 00:0c:29:3d:94:13。 
€ 主机 B 的 IP 为 1.1.1.10，MAC 地 址 为 0-50-56-C0-00-01。 


做 到 能 互相 ping 通 。 现 在 我 们 的 程序 在 主机 A 上 进行 抓 包 ， 在 B 上 向 A 发 送 一 些 IP 包 ( 比 
lil ping ©) ， 然 后 看 A 能 否 收 到 并 获取 地 址 。 


(2) 打开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <stdlib.h> 
#include <errno.h> 
#include <unistd.h> 
#include <sys/socket.h> 
#include <sys/types.h> 
#include <netinet/in.h> 
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#include «netinet/ip.h» 
#include «netinet/if ether.h» 
#include «arpa/inet.h» 
#include <stdlib.h> 

#include <string.h> 


int main(int argc, char **argv) { 


Tnt Sock, n; 

char buffer[2048]; 

struct ethhdr *eth; 

struct iphdr *iph; 

struct in addr addrl, addr2; 

long cn = 1; 

if (0 > (sock = socket(PF PACKET, SOCK RAW, htons(ETH P IP)))) { 
perror ("socket"); 
exit(1); 

) 


while (1) ( 
n = recvfrom(sock, buffer, 2048, 0, NULL, NULL); 


preintt(" 
printf("$d bytes readWn", n); 





// 接 收 到 的 数据 帧 前 6 字 节 是 目的 Mac 地 址 ， 紧 接着 6 字 节 是 源 Mac 地 址 
eth = (struct ethhdr*)buffer; // 获 取 以 太 网 帧 缓冲 区 首 地 址 
printf("Dest MAC addr:$02x:$02x:$02x:$02x:$02x:$02xWMn", 


eth-»h dest[0], eth-»h dest[1], eth-»h dest[2], eth->h dest[3], eth-»h dest[4], 
eth-»h dest[5]); 


printf("Source MAC addr:$02x:$02x:$02x:$02x:$02x:$02xWMn", 


eth-»h source[0], eth-»h source[1], eth-»h source[2], eth->h source[3], 
eth-»h source[4], eth-»h source[5]); 


) 


iph = (struct iphdr*) (buffer + sizeof(struct ethhdr)); 


memcpy(&addrl, &iph-»saddr, 4); // 复 制 IP 地 址 
memcpy(&addr2, &iph-»daddr, 4); // 复 制 IP 地 址 


// 我 们 只 对 IPV4 且 没有 选项 字段 的 IPv4 报 文 感 兴趣 

if (iph->version -- 4 && iph-»ihl == 5) { 
printf("Source host:$sMn",inet ntoa(addrl)); 
printf("Dest host:$sWn", inet ntoa (addr2)); 


在 代码 中 ， 先 获取 以 太 网 帧 缓冲 区 首 地 址 ， 然 后 打印 出 源 、 目 的 MAC 地 址 ， 接 着 获取 IP 包 
头 (iph)， 耳 包 作为 以 太 网 帧 的 数据 部 分 ， 只 需要 越过 以 太 网 帧 ， 就 可 以 得 到 IP 数据 包头 的 内 容 ， 
随后 打印 出 源 、 目 的 IP 地 址 。 
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(3) 保 存 为 testcpp, 然 后 上 传 到 Linux, 在 虚拟 机 的 终端 编译 并 运行 ,注意 不 要 通过 SecureCRT 
等 SSH 工具 去 编译 运行 ， 因 为 这 些 工具 都 会 发 送 IP 包 ， 影 响 程序 的 观察 效果 ， 所 以 最 好 在 虚拟 机 
Linux 的 终端 命令 行 下 编译 运行 ， 这 样 不 会 一 运行 就 不 停 地 抓 到 很 多 包 。 编 译 运 行 如 下 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 


此 时 ，test 程序 就 阻塞 在 recvfrom 处 等 待 IP 包 ， 我 们 可 以 在 主机 B 内 ping 主机 A: 








E:\Users\Administrator>ping 1.1.1.10 


正在 Ping 1.1.1.10 具有 32 字 节 的 数据 : 

来 自 1.1.1.10 的 回复 : 字 节 =32 时 间 <lms TTL-64 
来 自 1.1.1.10 的 回复 : 字 节 =32 时 间 <lms TTL=64 
KÁ 1.1.1.10 的 回复 : 字 节 =32 时 间 <lms TTL-64 
KÁ 1.1.1.10 的 回复 : 字 节 =32 时 间 <lms TTL-64 


发 了 4 个 ping 包 ， 此 时 主机 A 会 收 到 包 : 


[root@localhost test]# g++ test.cpp -o test 
[root@localhost test]# ./test 
count-1- 





74 bytes read 

Dest MAC addr:00:0c:29:3d:94:13 
Source MAC addr:00:50:56:c0:00:01 
Source host:1.1.1.1 

Dest host:1.1.1.10 


==count=2===================== 








74 bytes read 

Dest MAC addr:00:0c:29:3d:94:13 
Source MAC addr:00:50:56:c0:00:01 
Source host:1.1.1.1 

Dest host:1.1.1.10 


74 bytes read 

Dest MAC addr:00:0c:29:3d:94:13 
Source MAC addr:00:50:56:c0:00:01 
Source host:1.1.1.1 

Dest host:l.1.1.10 


74 bytes read 

Dest MAC addr:00:0c:29:3d:94:13 
Source MAC addr:00:50:56:c0:00:01 
Source host:1.1.1.1 

Dest host:1.1.1.10 


抓 到 4 个 包 后 ， 程 序 又 暂停 了 ， 继 续 等 待 。 至 此 ， 我 们 抓 IP 包 完 成 。ping 包 发 送 的 ICMP 报 
文 也 是 一 种 卫 包 ， 如 果 忘 记 了 ， 可 以 看 看 第 11 章 。 





==count=3===================== 








==count=4===================== 
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【 例 15.5】 发 送 和 接收 自 定义 类 型 的 链 路 层 数据 帧 ( 不 绑 定 ， 目 的 地 址 不 同 于 接收 网 卡 ) 


CD 准备 两 台 装 有 CentOS 7 的 虚拟 机 ， 即 主机 A 和 主机 B。 主 机 A 当 作 接收 端 ， 运 行 recv 
程序 ， 等 待 接收 数据 帧 ;主机 B 运行 send 程序 ， 当 作 发 送 端 ， 发 出 数据 帧 。 


主机 A 有 多 个 网 卡 ， 其 中 一 个 网 卡 eno16777736 的 IP 为 1.1.1.10，MAC 地 址 为 
00:0c:29:3d:94:13 。 另 一 个 网 卡 eno67109432 的 IP 为 1.1.1.11, MAC 地 址 为 00:0c:29:3d:94:31。 

注意 这 两 个 网 卡 地 址 不 同 ， 一 个 以 13 结尾 ， 另 一 个 以 31 结尾 ， 这 两 个 网 卡 都 接 在 虚拟 交换 
机 vmnetl 上 ,可 以 相互 ping 通 。 我 们 现在 在 主机 A 的 网 卡 eno16777736 上 等 待 接收 数据 ， 而 发 送 
端 B 发 出 的 数据 帧 的 目的 MAC 地 址 是 主机 A 的 网 卡 eno67109432 的 地 址 ， 但 因为 我 们 没有 做 绑 
定 操作 ， 所 以 接收 程序 recv 还 是 可 以 收 到 数据 的 。 原 因 在 前 面 已 经 提醒 注意 了 ， 这 里 不 再 歼 述 。 

主机 B 的 网 卡 eno16777736 的 IP 为 172.16.2.9，MAC 为 00:0c:29:ee:c9:3e， 当 作 发 送 端 ， 运行 
send 程序 。 


(20 创建 接收 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <string.h> 
#include <errno.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
#include <netpacket/packet.h> 
#include <net/if.h> 
#include <net/if arp.h> 
#include «sys/ioctl.h» 
#include <arpa/inet.h> //for htons 
#include <netinet/if ether.h» //for ethhdr 
#define LEN 60 
void print strl6(unsigned char buf[], size t len) 
t 
int Hu 
unsigned char c; 
if (buf -- NULL || len «- 0) 
return; 
for (i = 0; i < Len; itt) { 
c = buf[il; 
printf("t02x", c); 
} 
printf ("\n"); 
) 
void print sockaddr ll(struct sockaddr ll *sa) 
t 
if (sa == NULL) 
return; 
printf("sll family:$dWMn", sa-»5sll family); 
printf("sll protocol:%#x\n", ntohs(sa-^sll protocol)); 
printf("sll ifindex:$4$xWn", sa-»sll ifindex); 
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printf("sll hatype:$dWMn", sa-»sll hatype); 

printf("sll pkttype:$dWMn", sa-»5sll pkttype); 

printf("sll halen:$dWn", sa-»sll halen); 

printf("sll addr:"); print strl6(sa-»sll addr, sa->sll halen); 


int main() 


int result = 0, fd, n, count = 0; 
char buf [LEN] ; 

struct sockaddr ll sa recv; 

struct ifreq ifr; 

socklen t sa len - 0; 

char if name[] = "eno16777736"; 


struct ethhdr *eth; // 定 义 以 太 网 头 结构 体 指针 


//create socket 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 
MEEA < ET 

perror ("socket error\n"); 

return errno; 


} 


// 开 始 等 待 接收 数据 
while (1) ( 
memset(buf, 0, sizeof(buf)); 
n - recvfrom(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa recv, 
&sa len); 
/* 
如 果 不 需要 打印 sa_recv 内 容 ， 用 NULL 也 可 以 : 
n = recvfrom(fd, buf, sizeof(buf), 0, NULL, NULL); 
sy 
sug fences OU qi 
printf("sendto error, $dWn", errno); 
return errno; 
} 
printf(!"eeeeeeeeieee9eeee* reocyfrom msg &d Jeeccseecoceecoe pn, 
++count) ; 
print strl6((unsigned char*)buf, n); // 打 印 数 据 帧 的 内 容 


eth = (struct ethhdr*)buf; 

// 从 eth 里 提取 目的 mac、 源 mac、 协 议 号 

printf("proto-0x$04x,dst mac addr:$02x:$02x:$02x:$02x:2$02x:$02xWMn", 
ntohs (eth->h proto), eth->h dest[0], eth->h dest[1], eth-»h dest[2], 
eth-»h dest[3], eth->h dest[4], eth->h dest[5]); 

printf("proto-0x$04x,src mac addr:$02x:$02x:$02x:$02x:$02x:$02xWn", 
ntohs(eth-»h proto), eth->h source[0], eth-»h source[1], eth-»h source[2], 
eth-»h source[3], eth-»h source[4], eth-»h source[5]); 

print sockaddr ll(&sa recv); // 打 印 物理 层 地 址 sa_recv 的 内 容 

printf("sa len:%d\n", sa len); 





原始 套 接 字 编 程 第 15 党 





} 
return 0; 


} 


在 代码 中 ， 在 while 循环 中 调用 接收 函数 recvfrom， 这 样 套 接 字 就 会 在 这 个 地 址 上 等 到 数据 的 
接收 。 注 意 ， 我 们 在 recvfrom 函数 的 第 三 、 第 四 个 参数 中 没有 用 NULL， 这 样 可 以 获得 对 端 (发 
送 端 ) 的 物理 层 地 址 sockaddr 11 的 内 容 。 

我 们 每 收 到 一 个 以 太 网 数据 帧 ， 就 把 协议 号 、 源 、 目 的 地 址 打印 出 来 ， 再 通过 函数 print_str16 
打印 出 整个 数据 帧 ， 还 打印 了 sockaddr 1| 地 址 ， 虽 然 没 什么 具体 作用 ， 但 可 以 演示 以 太 网 数据 帧 
的 真实 面貌 ， 从 而 更 加 具体 地 了 解 以 太 网 数据 帧 , 为 以 后 在 实践 工作 中 分 析 网 络 数据 包 打 下 扎实 的 
基础 。 

保存 代码 为 recv.c， 然 后 上 传 到 主机 A (1.1.1.10) ， 编 译 并 运行 : 





[root@localhost test]# g++ recv.cpp -o recv 
[root@localhost test]# ./recv 


此 时 ，recv 程序 静 静 地 等 待 数 据 的 到 来 。 下 面 我 们 创建 发 送 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 

#include <string.h> 

#include <errno.h> 

#include <sys/types.h> 

#include <sys/socket.h> 

#include <netpacket/packet.h> 
#include <net/if.h> 

#include <net/if arp.h> 

#include «sys/ioctl.h» 

#include <arpa/inet.h> //for htons 


#define LEN 60 


void print strl6(unsigned char buf[], size t len) 
t 
int al 
unsigned char c; 
if (buf == NULL || len <= 0) 
return; 
for (i = 0; i < len; i++) ( 
c = buf[il; 
printf("*02x", c); 
} 
printf("Nn"); 


int main() 


int result — 0; 
int fd, n, count = 3, nsend = 0; // count 表 示 发 送 3 个 数据 包 


char buf [LEN]; 
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struct sockaddr 11 sa; 
struct ifreq EP 
char if name[] = "eno16777736"; // 本 机 要 发 送 数 据 的 网 卡 名 称 
/* 
dst_mac 是 主机 A 的 网 卡 eno67109432 的 MAC 地 址 , 注意 不 是 主机 A 的 网 卡 eno16777736 的 MAC 地 址 ， 
我 们 就 是 要 演示 这 样 的 场景 
Si 
char dst mac[6] = { 0x00,0x0c,0x29,0x3d,0x94,0x31 }; 
char src mac[6]; 
short type = htons (0x8902); 


memset (&sa, 0, sizeof(struct sockaddr 11)); 
memset (buf, 0, sizeof (buf)); 


// e ger 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 
Ie Eg ero) 
printf ("socket error, d\n", errno); 
return errno; 


) 
// 获 得 网 卡 索引 号 


strcpy(ifr.ifr name, if name); 

result = ioctl(fd, SIOCGIFINDEX, &ifr); 

if (result !- O) ( 
printf("get mac index error, %d\n", errno); 
return errno; 


} 
Sa.sll ifindex = ifr.ifr ifindex; // 赋 值 给 物理 层 地址 


// 得 到 源 MAC 地 址 ， 即 本 机 要 发 送 数 据 的 网 卡 MAC 地 址 

result = ioctl(fd, SIOCGIFHWADDR, &ifr); 

if (result !- 0) ( 
printf("get mac addr error, $dWMn", errno); 
return errno; 


) 
memcpy(src mac, ifr.ifr hwaddr.sa data, 6); 


// 设 置 数据 给 以 太 网 数据 帧 头 
memcpy(buf, dst mac, 6); 
memcpy(buf + 6, src mac, 6); 
memcpy(buf + 12, &type, 2); 


print strl6((unsigned char*)buf, sizeof(buf)); // 打 印 我 们 要 发 送 的 数据 帧 
// 准 备 发 送 数据 
while (count-- > 0) ( 
n = sendto(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa, 
sizeof(struct sockaddr 11)); 
sies estes 0) 
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printf("sendto error, %d\n", errno); 
return errno; 
! 
printf("sendto msg $d, len d\n", ++nsend, n); 
) 
return 0; 


) 


在 代码 中 ， 先 创建 了 套 接 字 ， 然 后 得 到 网 卡 索引 号 ， 赋 值 给 物理 层 地 址 sockaddr 11， 接 着 又 获 
取 了 源 MAC 地 址 ， 并 填充 了 以 太 网 数据 帧 头 ， 万 事 俱 备 后 ， 就 可 以 发 送 数据 了 。 

值得 注意 的 是 ， 默 认 情 况 下 ， 从 任何 接口 收 到 的 符合 指定 协议 〈 包 括 自 定 义 协 议 号 ) 的 所 有 
数据 报 文 都 会 被 传送 到 原始 PACKET 套 接 字 口 , 而 使 用 bind 系统 调用 并 以 一 个 sockaddr 1 结构 体 
对 象 将 PACKET 套 接 字 与 某 个 网 络 接口 相 绑 定 , 可 以 使 我 们 的 PACKET 原始 套 接 字 只 接收 指定 接 
口 的 数据 报 文 。 大 家 可 以 从 后 面 的 实例 中 深 深 体 会 到 这 一 点 。 因 此 ， 本 例 中 发 送 的 数据 帧 的 目的 
MAC 地 址 并 不 是 接收 端 网 卡 eno16777736 的 MAC 地 址 ， 而 接收 端 照 样 可 以 收 到 数据 ， 这 说 明 任 
何 接口 收 到 的 符合 指定 协议 〈 包 括 自 定义 协议 号 ) 的 所 有 数据 报 文 都 会 被 传送 到 原始 PACKET 套 
接 字 口 。 但 要 注意 的 是 ， 发 送 端 发 出 的 数据 帧 的 目的 MAC 地 址 必须 是 接收 端 主机 上 的 一 个 网 卡 的 
MAC 地 址 ， 而 且 这 个 网 卡 要 和 eno16777736 在 同一 网 段 〈 同 一 个 交换 机 上 ， 这 里 都 是 连接 在 虚拟 
交换 机 VMnetl 上 ) 。 

把 发 送 端 代码 保存 为 send.cpp， 然 后 上 传 到 主机 B， 在 命令 行 下 编译 并 运行 : 








[root@localhost send]# g++ send.cpp -o send 

[root@localhost send]# ./send 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

sendto msg 1, len 60 

sendto msg 2, len 60 

sendto msg 3, len 60 


此 时 ， 接 收 端 主机 A 上 变 为 : 


[root@localhost test]# g++ recv.cpp -o recv 

[rootélocalhost test]# ./recv 

Ke e e e e e ee ehe e hee e e e e e recvfrom msg Qo e ecc e e v ee v x 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:31 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

Sll family:1 

sll protocol:0 

sll ifindex:0x7ffd 

sll hatype:0 

sll pkttype:0 

sll halen:0 

Sll addr:sa len:18 
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doceoeeooeeeoeeeee* recyfrom msg 2 eeceeeecoeeeoor 

000c29349431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:31 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

000c29349431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

sll family:17 

sll protocol:0x8902 

sll ifindex:0x5 

Sll hatype:l 

Sll pkttype:0 

Sll halen:6 

sll addr:000c29eec93e 

sa len:18 

kkkkkkkkkkkkkkkkk*ž* recvfrom msg 3 eeeeecceooececer 

000c2934d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:31 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

000c2934d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

sll family:17 

sll protocol:0x8902 

Ssll ifindex:0x5 

sll hatype:1 

sll pkttype:0 

sll halen:6 

sll addr:000c29eec93e 

sa len:18 


mp. 3 个 数据 帧 都 收 到 了 ， 而 且 我 们 获得 了 发 送 端的 物理 层 地 址 ， 并 且 把 里 面 的 协议 号 
(sllL_protocol:0x8902) 都 打印 出 来 了 ， 而 且 把 发 送 端的 网 卡 地 址 〈sll_addr:000c29eec93e) 也 打印 
出 来 了 。 另 外 ,我们 打印 出 了 数据 帧 的 全 部 内 容 ， 可 以 看 到 以 太 网 数据 帧 头 后 面 都 是 堆 ， 因 为 我 们 
没有 填充 以 太 网 帧 的 数据 部 分 ， 所 以 类 型 字段 值 (8902) 后 面 都 是 0， 这 些 0 的 区 域 通常 用 来 存放 
上 层 协议 内 容 ， 比 如 IP E, ARP 包 等 。 

下 面 我 们 接着 做 实验 ， 接 收 端 绑 定 接收 网 卡 ， 然 后 发 送 端 再 发 送 目的 地 址 不 同 于 接收 网 卡 的 
数据 帧 ， 会 出 现 什 么 情况 呢 ? 我 们 拭目以待 。 


【 例 15.6】 发 送 和 接收 自 定义 类 型 的 链 路 层 数据 帧 ( 绑 定 ， 目 的 地 址 不 同 于 接收 网 卡 ) 

CD 准备 两 台 安装 的 CentOS 7 虚拟 机 ， 即 主机 A 和 主机 B。 主 机 A 当 作 接收 端 ， 运 行 recv 
程序 ， 等 待 接收 数据 帧 ， 主 机 B 运行 send 程序 ， 当 作 发 送 端 ， 发 出 数据 帧 。 

主机 A 有 多 个 网 卡 ， 其 中 一 个 网 卡 eno16777736 的 IP 为 1.1.1.10, MAC 地 址 为 
00:0c:29:3d:94:13， 另 一 个 网 卡 eno67109432 的 IP X 1.1.1.11, MAC 地 址 为 00:0c:29:3d:94:31。 

注意 这 两 个 网 卡 地 址 不 同 ， 一 个 以 13 结尾 ， 另 一 个 以 31 结尾 ， 这 两 个 网 卡 都 接 在 虚拟 交换 
机 vmnetl 上 ， 可 以 相互 ping 通 。 我 们 现在 在 主机 A 的 网 卡 eno16777736 上 等 待 接收 数据 ,并 且 把 
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套 接 字 和 网 卡 eno16777736 进行 了 绑 定 ， 即 只 接收 发 往 网 卡 eno16777736 的 数据 帧 。 而 发 送 端 B 
发 出 的 数据 帧 的 目的 MAC 地址 是 主机 A 的 网 卡 eno67109432 的 地 址 , 因为 我 们 在 接收 端 做 了 绑 定 
操作 ， 所 以 接收 程序 recv 是 接收 不 到 数据 的 。 原 因 在 前 面 已 经 提醒 注意 了 ， 这 里 不 再 獒 述 。 











(2) 创建 接收 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 

#include <string.h> 

#include <errno.h> 

#include <sys/types.h> 

#include <sys/socket.h> 

#include <netpacket/packet.h> 

#include <net/if.h> 

#include <net/if arp.h» 

#include «sys/ioctl.h» 

#include «arpa/inet.h» //for htons 

#include «netinet/if ether.h» //for ethhdr 
#define LEN 60 

void print strl6(unsigned char buf[], size t len) 


t 


} 


int iF 
unsigned char c; 
if (buf -- NULL || len «- 0) 


return; 
for (i = 0; i < len; itt) ( 
c = buf[il; 


printf("$02x", c); 
) 
printf("Nn"); 


void print sockaddr ll(struct sockaddr 11 *sa) 


t 


int 


if (sa -- NULL) 

return; 
printf("sll family:$dWMn", sa-»5sll family); 
printf("sll protocol:$$xWn", ntohs (sa->s11 protocol)); 
printf("sll ifindex:%#x\n", sa-»5sll ifindex); 
printf("sll hatype:$dWMn", sa-»sll hatype); 
printf("sll pkttype:$dWMn", sa-»5sll pkttype); 
printf("sll halen:$dWn", sa->sll halen); 


printf("sll addr:"); print strl6(sa-»sll addr, sa-»sll halen); 


main() 

int result = 0, fd, n, count = 0; 
char buf [LEN] ; 

struct sockaddr 11 Sa, Sa recv; 

struct ifreq TEE, 

socklen_t sa_len = 0; 
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char if name[] = "eno16777736"; 
Struct ethhdr *eth; // 定 义 以 太 网 头 结构 体 指针 


//create socket 


fd 


= socket (PF PACKET, SOCK RAW, htons(0x8902)); 


if (fd < 0) { 


perror ("socket error\n"); 
return errno; 


memset (&sa, 0, sizeof(sa)); 

sa.sll_family = PF PACKET; 

sa.sll_protocol = htons(0x8902); 

// get flags 

strcpy(ifr.ifr name, if name); 

result = ioctl(fd, SIOCGIFFLAGS, &ifr); // 必 须 先 得 到 flags， 才 能 得 到 index 
if (result != 0) ( 


} 


perror("ioctl error, get flags\n"); 
return errno; 


result - ioctl(fd, SIOCGIFINDEX, &ifr); //get index 
if (result != 0) ( 


) 


perror("ioctl error, get indexMn"); 
return errno; 


sa.sll ifindex - ifr.ifr ifindex; 

result - bind(fd, (struct sockaddr*)&sa, sizeof(struct sockaddr 11)); 
// 把 sa 绑 定 到 套 接 字 

if (result != 0) { 


) 


perror("bind error An"); 
return errno; 


// 开 始 接收 数据 
while (1) ( 


&sa len); 


++count) ; 


memset (buf, 0, sizeof (buf)); 
n = recvfrom(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa recv, 


A 
printf("sendto error, %d\n", errno); 
return errno; 


) 


printf ("xxx e*** reovyfrom msg $d Jeeeieeeeeeoceek gn, 


print stri6((unsigned char*)buf, n); 
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eth = (struct ethhdr*)buf; 

// 从 eth 里 提取 目的 mac、 源 mac、 协 议 号 

printf("proto-0x$04x,dst mac addr:$02x:$02x:$02x:$02x:$02x:$02xWMn", 
ntohs(eth-»h proto), eth-»h dest[0], eth->h dest[1], eth-»h dest[2], 
eth-»h dest[3], eth-»h dest[4], eth->h dest[5]); 

printf("proto-0x$04x,src mac addr:$02x:$02x:$02x:$02x:$02x:$02xMn", 
ntohs(eth-»h proto), eth->h source [0] ，eth->h source[1], eth-»h source[2], 
eth-»h source[3], eth->h source[4], eth->h source[5]); 


print sockaddr ll(&sa recv); 
printf("sa len:$dWn", sa len); 
) 
return 0; 


) 


在 代码 中 , 我 们 把 网 卡 enol6777736 和 套 接 字 进 行 了 绑 定 ， 因 此 将 在 网 卡 enol6777736 上 等 待 
接收 数据 ， 目 的 地 址 不 是 eno16777736 的 数据 帧 就 接收 不 到 了 。 
保存 代码 为 recv.c， 然 后 上 传 到 主机 A (1.1.1.10) ， 编 译 并 运行 : 


[root@localhost test]# g++ recv.cpp -o recv 
[root@localhost test]# ./recv 


此 时 ，recv 程序 静 静 地 等 竺 数据 的 到 来 。 下 面 我 们 创建 发 送 端的 代码 ， 打 开 UE， 输 入 代码 如 


#include <stdio.h> 

#include <string.h> 

#include <errno.h> 

#include <sys/types.h> 

#include <sys/socket.h> 

#include <netpacket/packet.h> 
#include <net/if.h> 

#include <net/if arp.h> 

#include <sys/ioctl.h> 

#include <arpa/inet.h> //for htons 


#define LEN 60 


void print strl6(unsigned char buf[], size t len) 
t 


int der 

unsigned char c; 

if (buf == NULL || len <= 0) 
return; 

for (1-2 0; i« len; itt) ( 
c = buf [i]; 


printf("%02x", c); 
1 
printft Nn" 
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} 
int main() 


{ 
int result = 0; 
int fd, n, count = 3, nsend = 0; // count 表 示 发 送 3 个 数据 包 
char buf [LEN] ; 
struct sockaddr 11 sa; 
struct ifreq dr. 
char if name[] = "eno16777736"; // 本 机 要 发 送 数据 的 网 卡 名 称 
/* 
dst_mac 是 主机 A 的 网 卡 eno67109432 的 MAC 地 址 , 注意 不 是 主机 A 的 网 卡 eno16777736 的 MAC 地 址 ， 
我 们 就 是 要 演示 这 样 的 场景 
SA 


char dst mac[6] = ( 0x00,0x0c,0x29,0x3d,0x94,0x31 }; 


char src mac[6]; 
short type - htons(0x8902); 


memset(&sa, 0, sizeof(struct sockaddr 11)); 
memset(buf, 0, sizeof(buf)); 


//a e ger 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 


IE (Eda s 0) t 
printf("socket error, %d\n", errno); 
return errno; 


} 
// 获 得 网 卡 索引 号 


strcpy(ifr.ifr name, if name); 

result - ioctl(fd, SIOCGIFINDEX, &ifr); 

if (result !- 0) { 
printf("get mac index error, $dMn", errno); 
return errno; 


) 
Sa.sll ifindex = ifr.ifr ifindex; // 赋 值 给 物理 层 地址 


// 得 到 源 MAC 地 址 ， 即 本 机 要 发 送 数 据 的 网 卡 MAC 地 址 
result = ioctl(fd, SIOCGIFHWADDR, &ifr); 
if (result !- 0) ( 
printf("get mac addr error, $dWMn", errno); 
return errno; 


) 
memcpy(src mac, ifr.ifr hwaddr.sa data, 6); 


// 设 置 数据 给 以 太 网 数据 帧 头 
memcpy (buf, dst mac, 6); 
memcpy (buf + 6, src mac, 6); 
memcpy(buf + 12, &type, 2); 
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print strl6((unsigned char*)buf, sizeof(buf)); // 打 印 我 们 要 发 送 的 数据 帧 
// 准 备 发 送 数据 
while (count-- > 0) ( 
n = sendto(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa, 
sizeof(struct sockaddr 11)); 
TENE L ot 
printf("sendto error, %d\n", errno); 
return errno; 
} 
printf("sendto msg $d, len $dWn", ++nsend, n); 
) 
return 0; 


) 


发 送 端 代码 和 上 例 的 发 送 端 代 码 一 样 。 所 发 送 的 数据 帧 的 目的 地 址 依然 不 是 主机 A 的 网 卡 
enol6777736 的 。 虽 然 上 例 可 以 收 到 数据 , 但 这 个 例子 就 收 不 到 了 。 把 发 送 端 代码 保存 为 send.cpp， 
然后 上 传 到 主机 B， 在 命令 行 下 编译 并 运行 : 





[root@localhost send]# ./send 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

sendto msg 1, len 60 

sendto msg 2, len 60 

sendto msg 3, len 60 


此 时 再 看 接收 端 主 机 A， 发 现 ; 


[root@localhost test]# g++ recv.cpp -o recv 

[root@localhost test]# ./recv 

依然 如 此 ，recv 程序 没有 收 到 数据 包 ， 这 说 明 我 们 绑 定 网 卡 eno16777736 后 ,recv 只 等 待 接收 
发 向 eno16777736 的 数据 帧 ， 而 send 的 数据 帧 是 发 向 eno67109432 的 ， 因 此 recv 收 不 到 。 下 面 把 
发 送 端的 数据 帧 的 目的 地 址 改 为 eno16777736 的 地 址 , 接收 端 就 可 以 收 到 数据 帧 ,具体 可 以 看 下 例 。 


【 例 15.7】 发 送 和 接收 自 定义 类 型 的 链 路 层 数据 帧 ( 绑 定 ， 目 的 地 址 同 于 接收 网 卡 ) 
(1) 准备 两 台 安装 CentOS. 7 的 虚拟 机 ， 即 主机 A 和 主机 B。 主 机 A 当 作 接收 端 ， 运 行 recv 
程序 ， 等 待 接收 数据 帧 ， 主 机 B 运行 send 程序 ， 当 作 发 送 端 ， 发 出 数据 帧 。 
主机 A 有 多 个 网 卡 ， 其 中 一 个 网 卡 eno16777736 的 IP 为 1.1.1.10，MAC 地 址 为 
00:0c:29:3d:94:13 。 另 一 个 网 卡 eno67109432 的 IP 为 1.1.1.11，MAC 地 址 为 00:0c:29:3d:94:31。 
注意 这 两 个 网 卡 地 址 不 同 ， 一 个 以 13 结尾 ， 另 一 个 以 31 结尾 ， 这 两 个 网 卡 都 接 在 虚拟 交换 
机 vmnetl 上 ,可 以 相互 ping 通 。 我 们 现在 在 主机 A 的 网 卡 eno16777736 上 等 待 接收 数据 ,并且 把 
套 接 字 和 网 卡 eno16777736 进行 了 绑 定 ， 即 只 接收 发 往 网 卡 eno16777736 的 数据 帧 。 本 例 中 ， 发 送 
端 B 发 出 的 数据 帧 的 目的 MAC 地 址 是 主机 A 的 网 卡 eno16777736 的 地 址 ， 我 们 的 接收 程序 recv 
是 可 以 接收 到 数据 的 。 











(2) 创建 接收 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 
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#include <stdio.h> 
#include <string.h> 
#include <errno.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
#include <netpacket/packet.h> 
#include <net/if.h> 
#include <net/if arp.h> 
#include <sys/ioctl.h> 
#include <arpa/inet.h> //for htons 
#include «netinet/if ether.h» //for ethhdr 
#define LEN 60 
void print strl6(unsigned char buf[], size t len) 
( 
int EF 
unsigned char c; 
if (buf == NULL || len <= 0) 


return; 
for (i = 0; i < len; i++) ( 
c = buf[i]; 


printf("$02x", c); 
) 
printf("Nn"); 
} 
void print sockaddr ll(struct sockaddr 11 *sa) 
{ 
if (sa == NULL) 
return; 
printf("sll family:$dWMn", sa->sll family); 
printf("sll protocol:$$xWn", ntohs(sa-»5sll protocol)); 
printf("sll ifindex:$4xWMn", sa-»sll ifindex); 
printf("sll hatype:$dWMn", sa-»sll hatype); 
printf("sll pkttype:%d\n", sa-»sll pkttype); 
printf("sll halen:$dWn", sa->sll halen); 
printf("sll addr:"); print strl6(sa-»sll addr, sa-»sll halen); 






int main() 


int result - 0, fd, n, count - 0; 
char buf [LEN] ; 

struct sockaddr 11 sa, Sa recv; 

struct ifreq afry 

socklen t sa len = 0; 

char if name[] = "eno16777736"; 


struct ethhdr *eth; // 定 义 以 太 网 头 结构 体 指针 


//create socket 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 
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Ete aao Gao ON 
perror ("socket error\n"); 
return errno; 


memset (&sa, 0, sizeof (sa)); 
sa.sll family = PF PACKET; 
sa.sll protocol = htons(0x8902); 
// get flags 
strcpy(ifr.ifr name, if name); 
result = ioctl(fd, SIOCGIFFLAGS, &ifr); // 必 须 先 得 到 flags， 才 能 得 到 indqex 
if (result != 0) ( 
perror("ioctl error, get flagsWMn"); 
return errno; 
) 
result = ioctl(fd, SIOCGIFINDEX, &ifr); //get index 
if (result !- 0) ( 
perror ("ioctl error, get indexMn"); 
return errno; 
) 
sa.sll ifindex = ifr.ifr ifindex; 
result - bind(fd, (struct sockaddr*)&sa, sizeof(struct sockaddr 11)); 
// 把 sa 绑 定 到 套 接 字 
if (result != 0) ( 
perror("bind error Nn"); 
return errno; 


) 


// 开 始 接收 数据 
while (1) ( 
memset(buf, 0, sizeof(buf)); 
n = recvfrom(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa recv, 
&sa len); 


iE (n0) 
printf("sendto error, $dWn", errno); 
return errno; 


) 


printf("Xxxkddoeeee*** reovfrom msg $d Jeeeeeeeeeeeoee gn, 
++count) ; 
print strl6((unsigned char*)buf, n); 


eth = (struct ethhdr*)buf; 

// 从 eth 里 提取 目的 mac、 源 mac、 协 议 号 

printf("proto-0x$04x,dst mac addr:$02x:$02x:$02x:$02x:2$02x:202xMn", 
ntohs(eth-»h proto), eth-»h dest[0], eth-»h dest[1], eth-»h dest[2], 
eth-»h dest[3], eth-»h dest[4], eth->h dest[5]); 

printf("proto-0x$04x,src mac addr:£$02x:$02x:$02x:$02x:2$02x:$02xWMn", 
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ntohs(eth-»h proto), eth->h _ source [0] ，eth->h source[1], eth-»h source[2], 
eth-»h source[3], eth-»h source[4], eth-»h source[5]); 


print sockaddr ll(&sa recv); 
printf("sa len:$dWNn", sa len); 
) 
return 0; 


) 


在 代码 中 , 我 们 把 网 卡 eno16777736 和 套 接 字 进 行 了 绑 定 ， 因 此 将 在 网 卡 eno16777736 上 等 待 
接收 数据 ， 目 的 地 址 不 是 eno16777736 的 数据 帧 就 接收 不 到 了 。 
保存 代码 为 recv.c， 然 后 上 传 到 主机 A (1.1.1.10) ， 编 译 并 运行 : 


[root@localhost test]# g++ recv.cpp -o recv 
[root@localhost test]# ./recv 


此 时 ，recv 程序 静 静 地 等 待 数 据 的 到 来 。 下 面 我 们 创建 发 送 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 

#include <string.h> 

#include <errno.h> 

#include <sys/types.h> 

#include <sys/socket.h> 

#include <netpacket/packet.h> 
#include <net/if.h> 

#include <net/if arp.h> 

#include <sys/ioctl.h> 

#include <arpa/inet.h> //for htons 


#define LEN 60 


void print strl6(unsigned char buf[], size t len) 
t 
int dE 
unsigned char c; 
if (buf == NULL || len <= 0) 
return; 
for (i = 0; i < len; i++) ( 
c = buf[il; 
printf("$02x", c); 
li 
printf 0 Nn 


li 
int main() 
t 
int result = 0; 
int fd, n, count = 3, nsend = 0; // count 表 示 发 送 3 个 数据 包 
char buf [LEN] ; 
struct sockaddr 11 sa; 
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struct ifreq 本 

char if name[] = "eno16777736"; // 本 机 要 发 送 数 据 的 网 卡 名 称 
/* dst_mac 是 主机 A 的 网 卡 eno16777736 的 MAC 地 址 */ 

char dst mac[6] = { 0x00,0x0c,0x29,0x3d,0x94, 0x13 }; 
char src mac[6]; 

short type = htons (0x8902); 


memset(&sa, 0, sizeof(struct sockaddr 11)); 
memset(buf, 0, sizeof(buf)); 


// 创 建 套 接 字 
fd = socket (PF PACKET, SOCK RAW, htons(0x8902)); 
LE (Eee ONT 

printf ("socket error, $dWn", errno); 

return errno; 


} 
// 获 得 网 卡 索引 号 


strcpy(ifr.ifr name, if name); 

result - ioctl(fd, SIOCGIFINDEX, &ifr); 

if (result != 0) ( 
printf("get mac index error, d\n", errno); 
return errno; 


} 
Sa.sll ifindex = ifr.ifr ifindex; // 赋 值 给 物理 层 地 址 


// 得 到 源 MAC 地 址 ， 即 本 机 要 发 送 数 据 的 网 卡 MAC 地 址 
result = ioctl(fd, SIOCGIFHWADDR, &ifr); 
if (result !- 0) ( 
printf("get mac addr error, $dWMn", errno); 
return errno; 
) 


memcpy(src mac, ifr.ifr hwaddr.sa data, 6); 


// 设 置 数据 给 以 太 网 数据 帧 头 
memcpy(buf, dst mac, 6); 
memcpy(buf * 6, src mac, 6); 
memcpy(buf * 12, &type, 2); 


print strl6((unsigned char*)buf, sizeof(buf)); // 打 印 我 们 要 发 送 的 数据 帧 
// 准 备 发 送 数据 
while (count-- > 0) ( 
n = sendto(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa, 
sizeof(struct sockaddr 11)); 
nO 
printf("sendto error, %d\n", errno); 
return errno; 
} 
printf("sendto msg $d, len d\n", ++nsend, n); 
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} 
return 0; 


} 


发 送 端 代码 和 上 例 的 发 送 端 代码 一 样 。 所 发 送 的 数据 帧 的 目的 地 址 依然 不 是 主机 A 的 网 卡 
eno16777736。 虽 然 上 例 可 以 收 到 ， 但 这 个 例子 就 收 不 到 了 。 把 发 送 端 代码 保存 为 send.cpp， 然 后 
上 传 到 主机 B， 在 命令 行 下 编译 并 运行 





[root@localhost send]# ./send 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

sendto msg 1, len 60 

sendto msg 2, len 60 

sendto msg 3, len 60 


此 时 再 看 接收 端 主机 A， 发 现 ; 


[root@localhost test]# g++ recv.cpp -o recv 

[root@localhost test]# ./recv 

[root@localhost test]# g++ recv.cpp -o recv 

[root@localhost test]# ./recv 

Ke oe ke e ke e ehe ee ke ke e ke e ke e e recvfrom msg Qo x e v ek e e e ee x 

000c2934d9413000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:13 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

sll family:1 

sll protocol:0 

sll ifindex:0 

sll hatype:52496 

sll pkttype:28 

sll halen:66 

sll addr:b47f000038de1625fd7f£000076971f42b47f00001100890202000000000000000 
0000000000000000000000080dc1625£d7£00003c00000003000000000000000100 

sa len:18 

kkkkkkkkkkkkkkkkk** recvfrom msg 2 kkkkkkkkkkkkkk*k*k 

000c293d9413000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:13 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

sll family:17 

Sll protocol:0x8902 

sll ifindex:0x2 

sll hatype:1 

sll pkttype:0 

sll halen:6 

sll addr:000c29eec93e 

sa len:18 


kkkkkkkkkkkkkkkkk*k* recyfrom msg 3 **ž*žkkkkkkkkkkkkk 
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000c293d9413000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:13 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

sll family:17 

sll protocol:0x8902 

sll ifindex:0x2 

sll hatype:l 

sll pkttype:0 

sll halen:6 

Ssll addr:000c29eec93e 

sa len:18 


recv 程序 收 到 数据 包 了 ,说 明 我 们 绑 定 网 卡 enol6777736 后 ,recv 只 等 待 接收 发 向 eno16777736 
的 数据 帧 ， 而 send 的 数据 帧 是 发 向 主机 A 的 网 卡 eno16777736 的 ， 因 此 recv 收 到 了 。 


【 例 15.8】 分 析 TCP, UDP, ICMP 和 IGMP 协议 


(1) 设置 虚拟 机 CentOS 的 IP 为 1.1.1.10 或 其 他 中 地址， 一 定 要 能 和 Windows 宿主 机 ping 通 。 
(2) 打开 UE， 输 入 代码 如 下 : 


#include «sys/types.h» 
#include «sys/socket.h» 
#include «sys/ioctl.h» 
#include <net/if.h> 

#include <string.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include «linux/if packet.h» 
#include «netinet/if ether.h» 
#include «netinet/in.h» 
#include <unistd.h> //for close 


typedef struct iphdr // 定 义 IP 首 部 

t 
unsigned char h verlen; //4 位 首部 长 度 +4 位 IP 版 本 号 
unsigned char tos; //8 位 服务 类 型 ToS 
unsigned short total len; //16 位 总 长 度 CEN) 
unsigned short ident; //16 位 标识 
unsigned short frag and flags; //3 位 标志 位 
unsigned char ttl; //8 位 生存 时 间 TTL 
unsigned char proto; //8 位 协议 (TCP、UDP 或 其 他 ) 
unsigned short checksum; //16 位 IP 首 部 校 验 和 
unsigned int sourceIP; //32 位 源 IP 地 址 
unsigned int destIP; //32 位 目的 ITP 地 址 

)IP HEADER; 


typedef struct  udphdr // 定 义 UDP 首 部 
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unsigned short uh sport; //16 位 源 端口 
unsigned short uh dport; //16 位 目的 端口 
unsigned int uh len;//16 位 UDP 包 长 度 
unsigned int uh sum;//16 位 校 验 和 

)UDP HEADER; 


typedef struct tcphdr // 定 义 TCP 首 部 

t 
unsigned short th sport; //16 位 源 端 口 
unsigned short th dport; //16 位 目的 端口 
unsigned int th seq; //32 位 序列 号 
unsigned int th ack; //32 位 确认 号 
unsigned char th lenres;//4 位 首部 长 度 /6 位 保留 字 
unsigned char th flag; //6 位 标志 位 
unsigned short th win; //16 位 窗口 大 小 
unsigned short th sum; //16 位 校 验 和 
unsigned short th urp; //16 位 紧急 数据 偏 移 量 

)TCP HEADER; 


typedef struct  icmphdr ( 
unsigned char icmp type; 
unsigned char icmp code; /* type sub code */ 
unsigned short icmp cksum; 
unsigned short icmp id; 
unsigned short icmp seq; 
/* This is not the std header, but we reserve space for time */ 
unsigned short icmp timestamp; 
)ICMP HEADER; 


void analyseIP(IP HEADER *ip); 

void analyseTCP(TCP HEADER *tcp); 
void analyseUDP(UDP HEADER *udp); 
void analyseICMP(ICMP HEADER *icmp); 


int main(void) 
t 
int sockfd; 
IP HEADER *ip; 
char buf[10240]; 
ssize t n; 
/* capture ip datagram without ethernet header */ 
if ((sockfd = socket(PF PACKET, SOCK DGRAM, htons(ETH P IP))) == -1) 
t 
printf("socket error!Wn"); 
return 1; 
l 
while (1) 
{ 
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n = recv(sockfd, buf, sizeof(buf), 0); 
if (n == -1) 
t 
printf("recv error! Mn"); 
break; 
5 
else if (n == 0) 
continue; 
// 接 收 数据 不 包括 数据 链 路 帧 头 
ip = (IP HEADER *) (buf); 
analyseIP (ip); 
size t iplen = (ip->h verlen & Ox0f) * 4; 
TCP HEADER *tcp = (TCP HEADER *) (buf + iplen); 
if (ip-»proto == IPPROTO TCP) 
t 
TCP HEADER *tcp = (TCP HEADER *) (buf + iplen); 
analyseTCP (tcp); 
} 
else if (ip->proto == IPPROTO UDP) 
t 
UDP HEADER *udp = (UDP HEADER *) (buf + iplen); 
analyseUDP (udp); 
) 
else if (ip-»proto == IPPROTO ICMP) 
t 
ICMP HEADER *icmp = (ICMP HEADER *)(buf + iplen); 
analyseICMP (icmp); 
) 
else if (ip-»proto == IPPROTO IGMP) 
t 
printf("IGMP----in"); 
) 
else 
t 
printf("other protocol! Vn"); 
} 
printf("NnWn") ; 
} 
close (sockfd); 
return 0; 


void analyseIP(IP HEADER *ip) 


t 


unsigned char* p = (unsigned char*)&ip-»sourceIP; 

printf("Source IPNt: $u.$u.$u.$uWMn", p[0], p[11, pI21, p[3]); 

p = (unsigned char*)&ip-»destIP; 

printf("Destination IPNt: $u.$u.$u.$uWn", p[0], p[1], p[2], p[31):; 
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} 


void analyseTCP(TCP_HEADER *tcp) 


{ 
print Tcp =~- Nnm. 
printf("Source port: $uWMn", ntohs(tcp-»5th sport)); 
printf("Dest port: $uWMn", ntohs(tcp-»th dport)); 

) 

void analyseUDP(UDP HEADER *udp) 

t 
printf('"UDP ===== Anmy- 
printf("Source port: %u\n", ntohs(udp-»uh sport)); 
printf("Dest port: $uWMn", ntohs(udp-»uh dport)); 

) 


void analyseICMP(ICMP HEADER *icmp) 

t 
printf ("ICMP ==—== Nn"); 
printf("type: %u\n", icmp->icmp type); 
printf("sub code: $uWn", icmp->icmp code); 


} 


代码 虽 长 ,但 不 难 ， 结 构 模 块 化 做 得 很 好 ,分 别 对 常见 的 几 个 协议 做 了 简单 分 析 ， 大 家 以 后 一 
线 实践 开发 时 ,可 以 以 此 为 模板 ,开发 出 更 为 强大 的 协议 分 析 器 来 ,作为 教学 不 能 太 复杂 ,简单 明 
了 是 第 一 位 的 。 


(3) 把 代码 保存 为 test.cpp， 上 传 到 Linux， 然 后 在 VM 虚拟 机 终端 窗口 下 编译 运行 ， 最 好 不 
要 通过 Windows 的 终端 工具 ， 因 为 这 样 会 抓 到 很 多 数据 包 ， 不 利于 我 们 观察 。 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 


然后 在 Windows T ping1.1.1.10， 此 时 可 以 看 到 test 程序 抓 到 包 了 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 

Source IP (aa e cab out 

Destination IP : 1.1.1.10 

TCMP 一 一 一 = 一 

type: 8 

sub code: 0 


Source IP Ee hh L oat 
Destination IP : 1.1.1.10 
"ROMPE S 

type: 8 

sub code: 0 
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Source IP e aP ET 
Destination IP : 1.1.1.10 
ITGMPa Es 

type: 8 


sub code: 0 


Source IP a a e p 
Destination IP : 1.1.1.10 
ICMP ----- 

type: 8 


sub code: 0 


Windows 下 的 ping 发 了 4 个 ICMP 包 ， 我 们 的 test 程序 同样 抓 到 了 4 个 ICMP 包 。 
15.7.2 ”混杂 模式 


1. 混杂 模式 基本 概念 

一 般 情况 下 ， 我 们 知道 网 卡 往往 只 会 接收 目的 地 址 是 它 的 数据 包 而 不 会 接收 目的 地 址 不 是 的 
它 的 数据 包 ， 所 以 网 卡 只 会 接收 该 接收 的 包 而 不 会 接收 其 他 地 址 的 网 络 数据 包 。 

混杂 模式 就 是 接收 所 有 经 过 网 卡 的 数据 包 ， 包 括 不 是 发 给 本 机 的 包 。 默 认 情 况 下 ， 网 卡 只 把 
发 给 本 机 的 包 (包括 广播 包 ) 传递 给 上 层 程序 ， 其 他 的 包 一 律 丢弃 。 简 单 地 讲 ， 混 杂 模 式 就 是 指 网 
卡 能 接收 所 有 通过 它 的 数据 流 ， 无 论 是 什么 格式 、 什 么 地 址 的 。 当 网 卡 处 于 这 种 “混杂 ”模式 时 ， 
该 网 卡 具备 “广播 地 址 ”， 它 对 所 有 遇 到 的 每 一 个 数据 帧 都 产生 一 个 硬件 中 断 ， 以 便 提 醒 操 作 系统 
处 理 流 经 该 物理 媒体 上 的 每 一 个 报 文 包 。 


2. 网 卡 的 工作 模式 
网 卡 具有 如 下 几 种 工作 模式 。 


CD 广播 模式 (Broad Cast Model) : 物理 地 址 CMAC) 是 OXffffff 的 帧 为 广播 帧 ， 工 作 在 广 
播 模式 的 网 卡 接收 广播 帧 。 

(2) 多 播 传送 (MultiCast Model) : 多 播 传送 地 址 作为 目的 物理 地 址 的 帧 可 以 被 组 内 的 其 他 
主机 同时 接收 , 而 组 外 主机 却 接收 不 到 。 但是， 如 果 将 网 卡 设置 为 多 播 传 送 模式 , 它 可 以 接收 所 有 
的 多 播 传送 帧 ， 而 不 论 它 是 不 是 组 内 成 员 。 

G) 直接 模式 (Direct Model) : 工作 在 直接 模式 下 的 网 卡 只 接收 目地 址 是 自己 Mac 地 址 的 帧 。 

(4) 混杂 模式 (Promiscuous Model) : 工作 在 混杂 模式 下 的 网 卡 接 收 所 有 流 过 网 卡 的 帧 ， 信 
包 捕 获 程序 就 是 在 这 种 模式 下 运行 的 。 

网 卡 的 默认 工作 模式 包含 广播 模式 和 直接 模式 , 即 它 只 接收 广播 帧 和 发 给 自己 的 帧 。 如 果 采 用 
混杂 模式 , 一 个 站 点 的 网 卡 将 接收 同一 网 络 内 所 有 站 点 所 发 送 的 数据 包 , 这 样 就 可 以 达到 对 网 络 信 
息 监视 捕获 的 目的 。 
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3. 命令 行 查看 、 设 置 、 取 消 混杂 模式 
查看 网 卡 是 否 为 混杂 模式 : 


[root@localhost ~]# ifconfig eno16777736 
enol6777736: flags-67«UP,BROADCAST,RUNNING» mtu 1500 
inet 1.1.1.10 netmask 255.255.255.0 broadcast 1.1.1.255 
inet6 fe80::20c:29ff:fe3d:9413 prefixlen 64 scopeid Ox20«link» 
ether 00:0c:29:3d:94:13 txqueuelen 1000 (Ethernet) 
RX packets 248 bytes 24067 (23.5 KiB) 
RX errors 0 dropped 0 overruns 0 frame 0 
TX packets 114 bytes 19218 (18.7 KiB) 
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 


如 果 flags=67<UP,BROADCAST,RUNNING> 信 息 中 没有 PROMISC, 就 说 明 当前 不 在 混杂 模式 
下 ， 如 果 有 则 处 于 混杂 模式 。 

设置 网 卡 为 混杂 模式 : 

[root@localhost ~]# ifconfig eno16777736 promisc 

设置 完 后 ， 再 查看 该 网 卡 : 


[root@localhost ~]# ifconfig eno16777736 
enol6777736: flags=323<UP,BROADCAST,RUNNING,PROMISC> mtu 1500 
inet 1.1.1.10 netmask 255.255.255.0 broadcast 1.1.1.255 
inet6 fe80::20c:29ff:fe3d:9413 prefixlen 64 scopeid 0Ox20«link» 
ether 00:0c:29:3d:94:13 txqueuelen 1000 (Ethernet) 
RX packets 345 bytes 32646 (31.8 KiB) 
RX errors 0 dropped 0 overruns 0 frame 0 
TX packets 188 bytes 34890 (34.0 KiB) 
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 


可 以 发 现 第 一 行 尖 括号 里 有 PROMISC 了 ， 说 明 网 卡 在 混杂 模式 下 了 。 
取消 网 卡 混杂 模式 : 


[root@localhost ~]# ifconfig eno16777736 -promisc 
设置 完 后 ， 再 查看 该 网 卡 : 


[root@localhost ~]# ifconfig eno16777736 
enol6777736: flags-323«UP,BROADCAST,RUNNING > mtu 1500 
inet 1.1.1.10 netmask 255.255.255.0 broadcast 1.1.1.255 
inet6 fe80::20c:29ff:fe3d:9413 prefixlen 64 scopeid 0x20«link» 
ether 00:0c:29:3d:94:13 txqueuelen 1000 (Ethernet) 
RX packets 345 bytes 32646 (31.8 KiB) 
RX errors 0 dropped 0 overruns 0 frame 0 
TX packets 188 bytes 34890 (34.0 KiB) 
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 


可 以 发 现 第 一 行 尖 括 号 里 没有 PROMISC 了 ， 说 明 网 卡 不 在 混杂 模式 下 了 。 
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4. 代码 方式 设置 网 卡 混杂 模式 


默认 情况 下 ， 网 卡 只 处 理 目 的 地 址 是 本 机 网 卡 地 址 的 包 ， 可 通过 设置 混杂 模式 使 网 卡 将 收 到 
的 所 有 包 〈 包 括 组 播 和 广播 ) 都 转发 给 操作 系统 。 代 码 片 段 如 下 : 


struct ifreq irr? 
strcpy(ifr.ifr name, if name); 
ioctl(fd, SIOCGIFFLAGS, &ifr); 
ifr.ifr flags |= IFF PROMISC; // 或 上 混杂 模式 标记 
ioctl(fd, SIOCSIFFLAGS, &ifr); 
主要 是 通过 两 次 调用 ioctl 函数 ， 先 获取 flag 标记 ， 再 加 上 (或 上 ) IFF_PROMISC， 然 后 重新 
设置 。 
【 例 15.9】 捕 获 网 络 上 的 数据 帧 ( 无 论 是 否 绑 定 ， 与 主机 同 网 段 的 数据 帧 ) 
(1) 准备 两 台 装 有 CentOS 7 的 虚拟 机 ， 即 主机 A 和 主机 B。 主 机 A 当 作 接 收 端 ， 运 行 recv 
程序 ， 等 待 接收 数据 帧 ; 主机 B 运行 send 程序 ， 当 作 发 送 端 ， 发 出 数据 帧 。 
主机 A 有 多 个 网 卡 ， 其 中 一 个 网 卡 eno16777736 的 IP 为 1.1.1.10，MAC 地 址 为 
00:0c:29:3d:94:13。 另 一 个 网 卡 eno67109432 的 IP 为 1.1.1.11，MAC 地 址 为 00:0c:29:3d:94:31。 
注意 这 两 个 网 卡 地 址 不 同 ， 一 个 以 13 结尾 ， 另 一 个 以 31 结尾 ， 这 两 个 网 卡 都 接 在 虚拟 交换 
机 vmnetl E, 可 以 相互 ping 通 。 我 们 现在 在 主机 A 的 网 卡 eno16777736 上 等 待 接收 数据 ， 并 且 把 
套 接 字 和 网 卡 eno16777736 HET TAE, 而 且 把 网 卡 eno16777736 设置 为 混杂 模式 , 这 样 即使 绑 定 
了 eno16777736， 也 可 以 收 到 不 是 发 往 eno16777736 的 数据 帧 ， 即 能 捕获 网 络 中 的 所 有 数据 帧 〈 本 
例 测 试 的 是 与 主机 同 网 段 的 数据 帧 )》， 这 就 是 混杂 模式 的 妙用 。 本 例 中 ， 发 送 端 B 发 出 的 数据 帧 
的 目的 MAC 地 址 是 主机 A 的 网 卡 eno67109432 的 地 址 ， 我 们 的 接收 程序 recv 是 可 以 接收 到 数据 
的 。eno16777736 和 eno67109432 都 是 A 主机 上 的 网 卡 ， 并 且 处 于 同一 网 段 。 


(2) 创建 接收 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 





#include <stdio.h> 
#include <string.h> 
#include <errno.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
#include <netpacket/packet.h> 
#include <net/if.h> 
#include «net/if arp.h» 
#include «sys/ioctl.h» 
#include «arpa/inet.h» //for htons 
#include «netinet/if ether.h»  //for ethhdr 
#define LEN 60 
void print strl6(unsigned char buf[], size t len) 
t 
int ate 
unsigned char c; 
if (buf -- NULL || len «- 0) 
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return; 
for (1 = 0; i «€ len; itt) ( 
c = buf[i]; 
printf("$02x", c); 
) 
printbt("Nn"ym 
) 
void print sockaddr ll(struct sockaddr ll *sa) 
t 
if (sa == NULL) 
return; 
printf("sll family:$dWMn", sa-»5sll family); 
printf("sll protocol:$$xWMn", ntohs(sa-»sll protocol)); 
printf("sll ifindex:%#x\n", sa-»sll ifindex); 
printf("sll hatype:$dWMn", sa-»sll hatype); 
printf("sll pkttype:$dWn", sa-»sll pkttype); 
printf("sll halen:$dWn", sa-»sll halen); 
printf("sll addr:"); print strl6(sa-»sll addr, sa-»sll halen); 


int main() 


int result = 0, fd, n, count = 0; 
char buf [LEN]; 

struct sockaddr 11 sa, sa recv; 

struct ifreq dry 

socklen t sa len = 0; 


char if name[] = "eno16777736"; 
struct ethhdr *eth; // 定 义 以 太 网 头 结构 体 指针 


//create socket 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 
DC EQ Ot 

perror("socket errorin"); 

return errno; 


memset(&sa, 0, sizeof(sa)); 
Sa.sll family = PF PACKET; 
sa.sll protocol - htons(0x8902); 


// get flags 
strcpy(ifr.ifr name, if name); // 必 须 先 得 到 flags， 才 能 得 到 index 
result = ioctl(fd, SIOCGIFFLAGS, &ifr); 
if (result !- 0) ( 
perror ("ioctl error, get flagsWMn"); 
return errno; 
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ifr.ifr flags |- IFF PROMISC; 

// 设 置 网 卡 为 混杂 模式 

result = ioctl(fd, SIOCSIFFLAGS, &ifr); 
if (result !- 0) ( 


perror ("ioctl error, set promisc Wn"); 
return errno; 


result - ioctl(fd, SIOCGIFINDEX, &ifr); //get index 
if (result !- 0) ( 


perror ("ioctl error, get indexTn"); 
return errno; 


Sa.sll ifindex = ifr.ifr ifindex; 
result = bind(fd, (struct sockaddr*)&sa, sizeof(struct sockaddr 11)); 


//bind fd 


if (result !- 0) ( 


perror("bind error Nn"); 
return errno; 


//xecvfrom 
while (1) ( 


&sa len); 


++count) ; 


memset (buf, 0, sizeof(buf)); 
n = recvfrom(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa_recv, 


if (n < ON f 
printf("recvfrom error, %d\n", errno); 
return errno; 


} 


printf("**kkkkkkkkkkkkkkkkk recyfrom msg %d Xeeeoeecoeecoce nn, 
print strl6((unsigned char*)buf, n); 
eth = (struct ethhdr*)buf; 


// 从 eth 里 提取 目的 mac、 源 mac、 协 议 号 
printf("proto-0x$04x,dst mac addr:$02x:$02x:$02x:$02x:202x:$02xWMn", 


ntohs(eth-»h proto), eth-»h dest[0], eth->h dest[1], eth->h dest[2], 
eth-»h dest[3], eth->h dest[4], eth->h dest[5]); 


printf("proto-0x$04x,src mac addr:$02x:$02x:$02x:$02x:2$02x:$02xWMn", 


ntohs(eth-»h proto), eth-»h source[0], eth-»h source[1], eth->h source[2], 
eth-»h source[3], eth-»h source[4], eth-»h source[5]); 


print sockaddr ll(&sa recv); 
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printf("sa len:%d\n", sa len); 
} 
return 0; 


} 


代码 和 上 例 几 乎 相同 ， 只 是 多 了 设置 混杂 模式 的 步 又。 保存 代码 为 recv.c， 然 后 上 传 到 主机 A 
(1.1.1.10) ， 编 译 并 运行 : 


[root@localhost test]# g++ recv.cpp -o recv 
[root@localhost test]# ./recv 


此 时 ，recv 程序 静 静 地 等 待 数据 的 到 来 。 下 面 我 们 创建 发 送 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 

#include <string.h> 

#include <errno.h> 

#include <sys/types.h> 

#include <sys/socket.h> 

#include <netpacket/packet.h> 
#include <net/if.h> 

#include «net/if arp.h» 

#include «sys/ioctl.h» 

#include «arpa/inet.h» //for htons 


#define LEN 60 


void print strl6(unsigned char buf[], size t len) 
t 
int d 
unsigned char c; 
if (buf == NULL || len «- 0) 
return; 
for (i = 0; i < len; i**) ( 
c = buf[il; 
printf("*02x", c); 
) 
printtotNnty 


int main() 


t 
int result — 0; 
int fd, n, count = 3, nsend = 0; 
char buf [LEN] ; 
struct sockaddr 11 sa; 
struct ifreq "BEY 
char if name[] = "eno16777736"; 
/* 


dst_mac 是 主机 A 的 网 卡 eno67109432 的 MAC 地 址 , 注意 不 是 主机 A 的 网 卡 eno16777736 的 MAC 地 
址 ， 我 们 就 是 要 演示 这 样 的 场景 ， 用 来 测试 混杂 模式 下 主机 A 的 网 卡 eno16777736 是 否 能 收 到 
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A 
char dst mac[6] = ( 0x00, Ox0c, 0x29, Ox3d, 0x94, 0x31 ); 
char src mac[6]; 
short type - htons(0x8902); 


memset(&sa, 0, sizeof(struct sockaddr 11)); 
memset (buf, 0, sizeof(buf)); 


//create socket 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 
TENEO LEi 

printf("socket error, $dWn", errno); 

return errno; 


//get index 

strcpy(ifr.ifr name, if name); 

result - ioctl(fd, SIOCGIFINDEX, &ifr); 

if (result !- 0) ( 
printf("get mac index error, $dMn", errno); 
return errno; 

) 


sa.sll ifindex = ifr.ifr ifindex; 


//get mac 

result - ioctl(fd, SIOCGIFHWADDR, &ifr); 

if (result != 0) ( 
printf("get mac addr error, $dWn", errno); 
return errno; 

) 


memcpy(src mac, ifr.ifr hwaddr.sa data, 6); 


//set buf 
memcpy(buf, dst mac, 6); 
memcpy(buf * 6, src mac, 6); 
memcpy(buf * 12, &type, 2); 


print strl6((unsigned char*)buf, sizeof (buf)); 
//sendto 
while (count-- > 0) ( 
n = sendto(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa, 
sizeof(struct sockaddr 11)); 
IE S coy 
printf("sendto error, d\n", errno); 
return errno; 
} 
printf ("sendto msg $d, len %d\n", ++nsend, n); 
} 


return 0; 





Linux C Ej C++ 一 线 开发 实践 





} 
代码 也 和 上 例 一 样 ， 把 发 送 端 代码 保存 为 send.cpp， 然 后 上 传 到 主机 B， 在 命令 行 下 编译 并 运行 : 


[root@localhost send]# ./send 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

sendto msg 1, len 60 

sendto msg 2, len 60 

sendto msg 3, len 60 


此 时 再 看 接收 端 主 机 A， 发 现 收 到 包 了 : 


[root@localhost test]# g++ recv.cpp -o recv 

[root@localhost test]# ./recv 

dk ke eee kk kk kk ***** recvfrom msg 了 Akk kkk kk kkk kk k k 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:31 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

sll family:1 

sll protocol:0 

sll ifindex:0 

sll hatype:15632 

sll pkttype:166 

Sll halen:126 

sll addr:687f0000f£80beca4fc7f£00007607a97e687£00001100890202000000000000000 
00000000000000000000000400aeca4£c7£00003c0000000300000000000000010000000000000 
00000000000000000000000003008400000000000£00beca4£c7£0000000000000000000000000 
000000000000000000000000000152b 

sa len:18 

Ke e he e ee kk kkk e e kkk e e recvfrom msg Qe e ee ke ee eee e e e e 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:31 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

Sll family:17 

Sll protocol:0x8902 

sll ifindex:0x2 

sll hatype:1 

sll pkttype:3 

Sll halen:6 

sll addr:000c29eec93e 

sa len:18 

炎炎 炎炎 火炎 交火 次 火炎 交火 类 火炎 六 类 类。 了 CV 下 OM msg 3 Jeeeeeecoeecoer 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:31 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

sll family:17 
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sll protocol:0x8902 
sll ifindex:0x2 

sll hatype:1 

sll pkttype:3 

sll halen:6 

sll addr:000c29eec93e 
sa len:18 


可 见 , 即使 我 们 绑 定 了 网 卡 , 但 只 要 设置 其 为 混杂 模式 , 依然 可 以 收 到 非 发 往 它 但 与 主机 同 网 
段 的 数据 帧 。 
【 例 15.10】 捕 获 网 络 上 的 数据 帧 ( 无 论 是 否 绑 定 ， 与 主机 不 同 网 段 的 数据 帧 ) 
CD 准备 两 台 装 有 CentOS 7 的 虚拟 机 ， 即 主机 A 和 主机 B。 主 机 A 当 作 接 收 端 ， 运 行 recv 
程序 ， 等 待 接收 数据 帧 ， 主机 B 运行 send 程序 ， 当 作 发 送 端 ， 发 出 数据 帧 。 
主机 A 有 多 个 网 卡 ， 其 中 一 个 网 卡 eno16777736 的 IP 为 1.1.1.10，MAC 地 址 为 
00:0c:29:3d:94:13 。 另 一 个 网 卡 eno50332208 的 IP 为 192.168.0.2, MAC 地 址 为 00:0c:29:3d:94:27。 
注意 这 两 个 网 卡 不 是 处 于 同一 网 段 , 不 能 互相 ping 通 。 我 们 现在 在 主机 A 的 网 卡 eno16777736 
上 等 待 接收 数据 , 并且 把 套 接 字 和 网 卡 eno16777736 进行 了 绑 定 ， 而 且 把 网 卡 eno16777736 设置 为 
混杂 模式 ， 这 样 即使 绑 定 了 eno16777736， 也 可 以 收 到 不 是 发 往 eno16777736 的 数据 帧 ， 即 能 捕获 
网 络 中 的 所 有 数据 帧 (本 例 测试 的 是 与 主机 不 同 网 段 的 数据 帧 ), 这 就 是 混杂 模式 的 妙用 。 本 例 中 ， 
发 送 端 B 发 出 的 数据 帧 的 目的 MAC 地 址 是 主机 A 的 网 卡 eno50332208 的 地 址 ， 我 们 的 接收 程序 
recv 是 可 以 接收 到 数据 的 。eno16777736 和 eno50332208 都 是 A 主机 上 的 网 卡 ， 但 处 于 不 同 网 段 。 


(20 创建 接收 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 














#include <stdio.h> 
#include <string.h> 
#include <errno.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
#include <netpacket/packet.h> 
#include <net/if.h> 
#include <net/if arp.h> 
#include «sys/ioctl.h» 
#include <arpa/inet.h> //for htons 
#include <netinet/if ether.h> //for ethhdr 
#define LEN 60 
void print strl6(unsigned char buf[], size t len) 
t 
int d 
unsigned char c; 
if (buf == NULL || len <= 0) 
return; 
for (i = 07; i < Yen; itt) f 
c = buf [il; 
printft("*02x", c); 
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} 
ipprzrnEf(Nn*ym 
} 
void print sockaddr 11l (struct sockaddr ll *sa) 
{ 
if (sa == NULL) 
return; 
printf("sll family:%d\n", sa->sll family); 
printf ("sll protocol:%#x\n", ntohs (sa->sll protocol) ); 
printf ("sll _ifindex:%#x\n", sa->sll ifindex); 
printf("sll hatype:$dWMn", sa-»sll hatype); 
printf("sll pkttype:$dWAn", sa-»sll pkttype); 
printf("sll halen:$dWn", sa-»sll halen); 
printf("sll addr:"); print strl6(sa-»sll addr, sa-»sll halen); 


) 
int main() 
t 
int result = 0, fd, n, count = 0; 
char buf [LEN] ; 
struct sockaddr 11 Sa, Sa recv; 
struct ifreq ifr; 
Socklen t sa len = 0; 


char if name[] = "eno16777736"; 
struct ethhdr *eth; // 定 义 以 太 网 头 结构 体 指针 


//create socket 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 
aes fuae cx map gf 

perror("socket errorin"); 

return errno; 


memset(&sa, 0, sizeof(sa)); 
sa.sll family = PF PACKET; 
sa.sll protocol - htons(0x8902); 


// get flags 
strcpy(ifr.ifr name, if name); // 必 须 先 得 到 flags， 才 能 得 到 index 
result = ioctl(fd, SIOCGIFFLAGS, &ifr); 
if (result !- 0) ( 
perror("ioctl error, get flagsWn"); 
return errno; 


ifr.ifr flags |- IFF PROMISC; 

// 设 置 网 卡 为 混杂 模式 

result = ioctl(fd, SIOCSIFFLAGS, &ifr); 
if (result l= O) ( 
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perror ("ioctl error, set promisc\n"); 
return errno; 


result = ioctl(fd, SIOCGIFINDEX, &ifr); //get index 
if (result != 0) { 

perror ("ioctl error, get index\n"); 

return errno; 


sa.sll_ifindex = ifr.ifr_ifindex; 
result = bind(fd, (struct sockaddr*)&sa, sizeof (struct sockaddr 11) ); 
//bind fd 
if (result != 0) ( 
perror("bind error Nn"); 
return errno; 


//xecvfrom 
while (1) ( 
memset(buf, 0, sizeof(buf)); 
n = recvfrom(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa recv, 
&sa len); 


TES SYST 
printf("recvfrom error, %d\n", errno); 
return errno; 
) 
printf("xxdooeeeeeeeee* reoyfrom msg $d J**eeeeeeeeeeocee An, 
++count) ; 
print strl6((unsigned char*)buf, n); 


eth = (struct ethhdr*)buf; 

// 从 eth 里 提取 目的 mac、 源 mac、 协 议 号 

printf("proto-0x$04x,dst mac addr:$02x:$02x:$02x:$02x:9$02x:202xWn", 
ntohs(eth-»h proto), eth-»h dest[0], eth->h dest[1], eth-»h dest[2], 
eth-»h dest[3], eth->h dest[4], eth-»h dest[5]); 

printf("proto-0x$04x,src mac addr:$02x:$02x:$02x:$02x:202x:$02xWMn", 
ntohs(eth-»h proto), eth->h source[0], eth->h source[1], eth-»h source[2], 
eth-»h source[3], eth-»h source[4], eth-»h source[51); 


print sockaddr ll(&sa recv); 
printf("sa len:$dWMn", sa len); 
H 
return 0; 


} 


代码 和 上 例 几乎 相同 ， 只 是 多 了 设置 混杂 模式 的 步骤 。 保 存 代 码 为 recv.c， 然 后 上 传 到 主机 A 
(1.1.1.10) ， 编 译 并 运行 : 





Linux C E C++ 一 线 开发 实践 





[root@localhost test]# g++ recv.cpp -o recv 
[rootélocalhost test]# ./recv 


此 时 ，recv 程序 静 静 地 等 待 数据 的 到 来 。 下 面 我 们 创建 发 送 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 

#include <string.h> 

#include <errno.h> 

#include <sys/types.h> 

#include <sys/socket.h> 

#include <netpacket/packet.h> 
#include <net/if.h> 

#include «net/if arp.h» 

#include «sys/ioctl.h» 

#include «arpa/inet.h» //for htons 


#define LEN 60 


void print strl6(unsigned char buf[], size t len) 
{ 

int d 

unsigned char c; 

if (buf == NULL || len <= 0) 


return; 
for (i = 0; i < len; i++) ( 
c = buf[il; 


printf("$02x", c); 
) 
printf(Nntys 


int main() 


int result = 0; 

int fd, n, count = 3, nsend = 0; 
char buf [LEN] ; 

struct sockaddr 11 sa; 

struct ifreq IEE? 

char if name[] = "eno16777736"; 


/* 
dst_mac 是 主机 A 的 网 卡 eno50332208 的 MAC 地 址 ， 注 意 不 是 主机 A 的 网 卡 eno16777736 的 MAC 地 
址 ， 我 们 就 是 要 演示 这 样 的 场景 ， 用 来 测试 混杂 模式 下 主机 A 的 网 卡 eno16777736 是 否 能 收 到 
ga 
char dst mac[6] = { 0x00,0x0c,0x29,0x3d,0x94,0x27 ); 
char src mac[6]; 
short type - htons(0x8902); 


memset(&sa, 0, sizeof(struct sockaddr 11)); 
memset(buf, 0, sizeof(buf)); 
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//create socket 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 
if aL 0) t 

printf("socket error, $dWn", errno); 

return errno; 


//get index 

strcpy(ifr.ifr name, if name); 

result - ioctl(fd, SIOCGIFINDEX, &ifr); 

if (result !- 0) ( 
printf("get mac index error, d\n", errno); 
return errno; 

) 


sa.sll ifindex - ifr.ifr ifindex; 


//get mac 
result - ioctl(fd, SIOCGIFHWADDR, &ifr); 
if (result != 0) ( 


printf("get mac addr error, $dWMn", errno); 
return errno; 


) 


memcpy(src mac, ifr.ifr hwaddr.sa data, 6); 


//set buf 

memcpy(buf, dst mac, 6); 
memcpy(buf * 6, src mac, 6); 
memcpy(buf * 12, &type, 2); 


print strl6((unsigned char*)buf, sizeof (buf)); 
//sendto 
while (count-- > 0) ( 
n = sendto(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa, 
sizeof(struct sockaddr 11)); 
IE (mn AO 
printf("sendto error, %d\n", errno); 
return errno; 
) 
printf("sendto msg $d, len $dWn", --*nsend, n); 
} 
return 0; 


了 
代码 也 和 上 例 一 样 ， 把 发 送 端 代码 保存 为 send.cpp， 然 后 上 传 到 主机 B， 在 命令 行 下 编译 并 运行 : 


[root@localhost send]# ./send 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

sendto msg 1, len 60 

sendto msg 2, len 60 
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sendto msg 3, len 60 
此 时 再 看 接收 端 主机 A， 发 现 收 到 包 了 : 


[rootélocalhost test]# ./recv 

docebeeoeeeeooeeeee* recyfrom msg 1 Jeeeceececoeceoor 

000c29389427000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:27 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

sll family:1 

Sll protocol:0 

sll ifindex:0 

sll hatype:36112 

Sll pkttype:163 

Sll halen:229 

sll addr:c77f000068ea7af4fd7£00007657a6e5c77£00001100890202000000000000000 
00000000000000000000000b0e87a£4£d7£00003c0000000300000000000000010000000000000 
00000000000000000000000003008400000000000606a7a£4£d47£0000000000000000000000000 
000000000000000000000000000157be9e4c77£0000000000002000000068ea7af4fd7£0000000 
0000001000000800a40000000000000000000000000008aba84775200942c30084000000000006 
0ea7af£4£d7£0000000000000000000000000000000000008abaa4a447e86fd38abale8260c91bd 
300 

sa len:18 

kkkkkkkkkkkkkkkkk** reocvyfrom msg 2 e6eeeeeieceooeiek 

000c2934d9427000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:27 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

sll family:17 

sll protocol:0x8902 

sll ifindex:0x2 

sll hatype:1 

sll pkttype:3 

Sll halen:6 

sll addr:000c29eec93e 

sa len:18 

kkkkkkkkkkkkkkkkkš* reovfrom msg 3 Jeeeeeceeooekicoek 

000c293d9427000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:0c:29:3d:94:27 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

sll family:17 

sll protocol:0x8902 

sll ifindex:0x2 

sll hatype:1 

sll pkttype:3 

sll halen:6 

sll addr:000 
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可 见 ， 即 使 我 们 绑 定 了 网 卡 , 但 只 要 设置 其 为 混杂 模式 , 依然 可 以 收 到 非 发 往 它 、 非 同一 子 网 
的 同 主机 网 卡 的 数据 帧 .下 面 的 例子 是 终极 情况 , 测试 能 否 捕捉 到 发 往 一 个 不 存在 的 网 卡 的 数据 帧 。 


【 例 15.11】 捕 获 网 络 上 的 数据 帧 ( 无 论 绑 定 ， 并 不 存在 的 网 卡 的 数据 帧 ) 
CD 准备 两 台 装 有 CentOS 7 的 虚拟 机 ， 即 主机 A 和 主机 B。 主 机 A 当 作 接 收 端 ， 运 行 recv 
程序 ， 等 待 接收 数据 帧 ， 主 机 B 运行 send 程序 ， 当 作 发 送 端 ， 发 出 数据 帧 。 
主机 A 有 多 个 网 卡 , 其 中 一 个 网 卡 eno16777736 的 IP 为 1.1.1.10, MAC 地 址 为 00:0c:29:3d:94:13 。 
我 们 现在 在 主机 A 的 网 卡 eno16777736 上 等 待 接收 数据 ， 并 且 把 套 接 字 和 网 卡 eno16777736 
进行 了 绑 定 ， 而 且 把 网 卡 eno16777736 设置 为 混杂 模式 ， 这 样 即使 绑 定 了 eno16777736， 也 可 以 收 
到 不 是 发 往 eno16777736 的 数据 帧 ， 即 能 捕获 网 络 中 的 所 有 数据 帧 (本 例 测试 的 是 发 往 并 不 存在 的 
网 卡 的 数据 帧 )， 这 就 是 混杂 模式 的 妙用 。 本 例 中 ， 发送 端 B 发 出 的 数据 帧 的 目的 MAC 地 址 并 不 
存在 ， 我 们 的 接收 程序 recv 依然 是 可 以 接收 到 数据 的 。 


(2) 创建 接收 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 














#include <stdio.h> 
#include <string.h> 
#include <errno.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
#include <netpacket/packet.h> 
#include <net/if.h> 
#include <net/if arp.h> 
#include <sys/ioctl.h> 
#include <arpa/inet.h> //for htons 
#include <netinet/if ether.h» //for ethhdr 
#define LEN 60 
void print strl6(unsigned char buf[], size t len) 
1 
int i; 
unsigned char c; 
if (buf == NULL || len <= 0) 
return; 
for (i = 0; i « len; itt) ( 
c = buf[i]; 
printf("$02x", c); 
} 
printf ("Nn"); 
5 
void print sockaddr ll(struct sockaddr 11 *sa) 
t 
if (sa == NULL) 
return; 
printf("sll family:$dWNn", sa-»sll family); 
printf("sll protocol:$£xWn", ntohs(sa-»sll protocol)); 
printf("sll ifindex:%#x\n", sa-»sll ifindex); 
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printf("sll hatype:%d\n", sa->sll hatype); 

printf("sll pkttype:$dWMn", sa-»5sll pkttype); 

printf("sll halen:$dWn", sa-»sll halen); 

printf("sll addr:"); print strl6(sa-»sll addr, sa->sll halen); 


int main() 


t 
int result = 0, fd, n, count = 0; 
char buf [LEN] ; 
struct sockaddr 11 sa, sa recv; 
struct ifreq ifr; 
socklen t sa len - 0; 
char if name[] = "eno16777736"; 


struct ethhdr *eth; // 定 义 以 太 网 头 结构 体 指针 


//create socket 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 
LE (Ed <S ON T 

perror ("socket error\n"); 

return errno; 


memset (&sa, 0, sizeof (sa)); 
Sa.sll family = PF PACKET; 
sa.sll protocol = htons(0x8902); 


// get flags 
strcpy(ifr.ifr name, if name); // 必 须 先 得 到 flags， 才 能 得 到 index 
result = ioctl(fd, SIOCGIFFLAGS, &ifr); 
if (result !- 0) ( 
perror("ioctl error, get flagsWMn"); 
return errno; 


ifr.ifr flags |- IFF PROMISC; 
// 设 置 网 卡 为 混杂 模式 
result = ioctl(fd, SIOCSIFFLAGS, &ifr); 
if (result !- 0) ( 
perror ("ioctl error, set promiscWn"); 
return errno; 


result - ioctl(fd, SIOCGIFINDEX, &ifr); //get index 
if (result != 0) ( 

perror ("ioctl error, get index\n"); 

return errno; 
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sa.sll ifindex = ifr.ifr ifindex; 
result - bind(fd, (struct sockaddr*)&sa, sizeof(struct sockaddr 11)); 


//bind fd 
if (result !- 0) ( 
perror("bind error in"); 
return errno; 
) 
//xecvfrom 
while (1) ( 
memset(buf, 0, sizeof(buf)); 
n = recvfrom(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa recv, 
&sa len); 


IELO 
printf("recvfrom error, %d\n", errno); 
return errno; 


) 


printf("Xdooekieeeeeeee* reevfrom msg $d *eeeeeoceeeooee nn, 


++count) ; 
print_str16( (unsigned char*)buf, n); 


eth = (struct ethhdr*)buf; 


// 从 eth 里 提取 目的 mac、 源 mac、 协 议 号 
printf("proto-0x$04x,dst mac addr:%02x:%02x:%02x:%02x:%02x:%02x\n", 


ntohs(eth-»h proto), eth->h dest[0], eth->h dest[1], eth->h dest[2], 


eth-»h dest[3], eth-»h dest[4], eth->h dest[5]); 
printf("proto-0x$04x,src mac addr:$02x:$02x:$02x:$02x:$02x:9$02xWn", 


ntohs(eth-»h proto), eth->h source[0], eth-»h source[1], eth-»h source[2], 
eth-»h source[3], eth->h source[4], eth->h source[5]); 


print sockaddr ll(&sa recv); 
printf("sa len:$dWn", sa len); 
} 
return 0; 
jj 


代码 和 上 例 几 乎 相同 ， 只 是 多 了 设置 混杂 模式 的 步 又。 保存 代码 为 recv.c， 然 后 上 传 到 主机 A 
(1.1.1.10) ， 编 译 并 运行 : 


[rootelocalhost test]# g++ recv.cpp -o recv 
[rootélocalhost test]# ./recv 


此 时 ，recv 程序 静 静 地 等 待 数据 的 到 来 。 下 面 我 们 创建 发 送 端的 代码 ， 打 开 UE， 输 入 代码 如 下 : 


#include <stdio.h> 
#include <string.h> 
#include <errno.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
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#include «netpacket/packet.h» 
#include «net/if.h» 

#include «net/if arp.h> 

#include <sys/ioctl.h> 

#include <arpa/inet.h> //for htons 


#define LEN 60 


void print_str16 (unsigned char buf[], size t len) 


t 
int i; 
unsigned char c; 
if (buf -- NULL || len «- 0) 
return; 
for (i = 0; i < len; itt) ( 
c = buf[i]; 
printf("$02x", c); 
) 
printf("Nn"); 
) 
int main() 
{ 
int result = 0; 
int fd, n, count = 3, nsend = 0; 
char buf [LEN] ; 
struct sockaddr 11 sa; 
struct ifreq AEEA 
char if name[] = "eno16777736"; 
/* 
下 面 的 dst_mac 地 址 并 不 存在 于 主机 A 上 ， 网 络 上 也 没有 
和 


char dst mac[6] = { 0x00,0x01, 0x01, 0x01, 0x01, 0x01 
char src mac[6]; 
short type = htons (0x8902); 


memset(&sa, 0, sizeof(struct sockaddr 11)); 
memset(buf, 0, sizeof(buf)); 


//create socket 
fd = socket(PF PACKET, SOCK RAW, htons(0x8902)); 
iie col cs. (2). di 

printf("socket error, $dWn", errno); 

return errno; 


//get index 
strcpy(ifr.ifr name, if name); 
result - ioctl(fd, SIOCGIFINDEX, &ifr); 


}; 
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if (result != 0) ( 
printf("get mac index error, $dWMn", errno); 
return errno; 

} 

sa.sll ifindex = ifr.ifr ifindex; 


//get mac 

result = ioctl(fd, SIOCGIFHWADDR, &ifr); 

if (result !- 0) ( 
printf("get mac addr error, $dWMn", errno); 
return errno; 

) 


memcpy(src mac, ifr.ifr hwaddr.sa data, 6); 


//set buf 

memcpy(buf, dst mac, 6); 
memcpy(buf * 6, src mac, 6); 
memcpy(buf * 12, &type, 2); 


print strl6((unsigned char*)buf, sizeof (buf)); 
//sendto 
while (count-- » 0) ( 
n = sendto(fd, buf, sizeof(buf), 0, (struct sockaddr *)&sa, 
sizeof (struct sockaddr 11)); 
i£ (m <0) { 
printf ("sendto error, %d\n", errno); 
return errno; 
} 
printf("sendto msg $d, len $dWn", ++nsend, n); 
) 
return 0; 


) 
代码 也 和 上 例 一 样 ， 把 发 送 端 代码 保存 为 send.cpp， 然 后 上 传 到 主机 B， 在 命令 行 下 编译 并 运行 ; 


[root@localhost send]# ./send 

000c293d9431000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

sendto msg 1, len 60 

sendto msg 2, len 60 

sendto msg 3, len 60 


此 时 再 看 接收 端 主机 A， 发 现 收 到 包 了 : 


[rootélocalhost test]# ./recv 

doebeeboeeoeeeooóoo reovfrom msg l Je6eeeesecoooeex 

000101010101000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:01:01:01:01:01 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 
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sll family:1 

Sll protocol:0 

sll ifindex:0 

sll hatype:64784 

sll pkttype:126 

sll halen:13 

Sll addr:347f00008876a98bfc7f£000076 

sa len:18 

JOOeooooeeeeoeeeee reovfrom msg 2 k dk kk k k 

000101010101000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto=0x8902,dst mac addr:00:01:01:01:01:01 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

Sll family:17 

sll protocol:0x8902 

sll ifindex:0x2 

sll hatype:1 

Sll pkttype:3 

sll halen:6 

Sll addr:000c29eec93e 

sa len:18 

Ke oe je e hee ehe ehe ke ke e e e ke e e recvfrom msg 3 dk ce e ek e e ee e € 

000101010101000c29eec93e89020000000000000000000000000000000000000000000000 
0000000000000000000000000000000000000000000000 

proto-0x8902,dst mac addr:00:01:01:01:01:01 

proto-0x8902,src mac addr:00:0c:29:ee:c9:3e 

Sll family:17 

sll protocol:0x8902 

sll ifindex:0x2 

sll hatype:1 

sll pkttype:3 

Sll halen:6 

sll addr:000c29eec93e 

sa len:18 


依然 收 到 数据 帧 了 ， 说 明 B 发 出 的 数据 帧 在 网 络 上 出 现 了 ， 这 样 就 被 混杂 的 A 捕获 到 了 ， 而 
根本 不 去 管 是 不 是 发 往 主 机 A 的 数据 帧 。 


15.7.3 ” 链 路 层 原始 套 接 字 开 发 注意 事项 
在 面向 链 路 层 的 原始 套 接 字 一 线 实践 开发 中 ， 有 以 下 几 点 需要 注意 。 


(1) 原始 套 接 字 要 尽量 绑 定 网 卡 ， 因 为 收 到 的 适合 类 型 的 报 文 除了 会 被 分 发 给 绑 定 在 该 网 卡 
上 的 原始 套 接 字 外 ， 还 会 分 发 给 没有 绑 定 网 卡 的 原始 套 接 字 ， 如 果 原 始 套 接 字 创建 得 较 多 , 一 个 报 
文 就 会 在 软 中 断 上 下 文中 分 发 多 次 ， 影 响 性 能 。 如 果 绑 定 了 网 卡 ， 就 只 会 收 到 发 给 网 卡 的 数据 帧 ， 
不 是 发 送 给 网 卡 的 就 不 需要 再 去 接收 了 ， 减 少 了 软 中 断 次 数 。 

(2) 绑 定 网 卡 后 的 原始 套 接 字 还 有 另 一 个 好 处 ,就 是 可 以 直接 调用 send 发 送 以 太 网 帧 ; 否则 
就 需要 在 发 送 时 调用 sendto/sendmsg 来 额外 指定 网 卡 ,大 家 应 该 还 记得 sendto 函数 中 需要 设置 struct 
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sockaddr* 人 参数 ， 忘 记 了 赶紧 复习 一 下 。 绑 定 后 ， 就 可 以 用 send 函数 发 送 了 ， 该 函数 更 简单 。 

(3) 若 只 接收 指定 类 型 的 二 层 报 文 ， 在 调用 socket() 创 建 时 最 好 指定 第 3 个 参数 的 协议 类 型 ， 
而 避免 使 用 ETH_P_ALL, 因为 ETH P ALL 会 接收 所 有 类 型 的 报 文 , 而 且 还 会 将 外 发 报 文 收回 来 ， 
这 样 就 需要 做 BPF 过 滤 ， 比 较 影 响 性 能 。 笔 者 以 前 在 项 目 开 发 中 因为 用 了 ETH _P_ALL， 导 致 性 能 
不 高 ， 还 被 嘲笑 了 ， 这 点 也 是 经 验 之 谈 。 

(4) 原始 套 接 字 编程 必须 是 root 用 户 。 

C5) 原始 套 接 字 不 支持 connectO 操 作 。 





15.8 ”面向 IP 层 的 原始 套 接 字 编程 


前 面 我 们 讲 了 面向 链 路 层 的 原始 套 接 字 ， 可 以 在 链 路 层 上 获取 数据 帧 。 现 在 我 们 讲解 面向 IP 
层 的 原始 套 接 字 ， 它 可 以 获取 网 络 层 上 的 数据 包 。 

要 创建 面向 TP 层 的 原始 套 接 字 ， 也 是 通过 原始 套 接 字 创建 函数 socket， 只 要 指定 socket 函数 
的 第 一 个 参数 为 AF_INET， 第 二 个 参数 为 SOCK_ RAW (如 果 第 二 个 参数 是 SOCK_STREAM， 创 
建 的 就 是 TCP 流 式 套 接 字 ; 如 果 是 SOCK_DGRAM, 创建 的 就 是 UDP 数据 报 套 接 字 ， 这 两 种 都 是 
标准 套 接 字 ) ， 就 可 以 创建 这 种 网 络 层 的 原始 套 接 字 ， 比 如 : 


Socket(AF INET,SOCK RAW,protocol); 


AF INET 表示 获取 从 网 络 层 开始 的 数据 ;protocol 字段 定义 在 netinet/in.h 中 ， 常 见 的 有 
IPPROTO_TCP IPPROTO_UDP、IPPROTO_ICMP、IPPROTO_RAW。 注 意 : 构建 网 络 层 的 原始 套 
接 字 时 ，protocol 参数 不 能 为 0 (IPPROTO_IP) ， 因 为 这 样 会 导致 系统 不 知道 用 哪 种 协议 。 另 外 ， 
在 这 里 protocol 参数 不 需要 htons， 这 一 点 和 链 路 层 原始 套 接 字 不 同 。 

当 接 收 包 时 ， 表 示 用 户 获 得 完整 的 包含 TP 报头 的 数据 包 ， 即 数据 从 IP 报头 开始 算 起 。 

当 发 送 包 时 ， 用 户 只 能 发 送 包含 TCP 报头 、UDP 报头 或 包含 其 他 传输 协议 的 报 文 ，IP 报头 以 
及 以 太 网 帧 头 则 由 内 核 自动 加 封 。 除 非 是 设置 了 IP HDRINCL 的 socket 选项 ， 即 默认 情况 下 ， 我 
们 所 构造 的 报 文 从 IP 首部 之 后 的 第 一 个 字 节 开 始 ，IP 首部 由 内 核 自己 维护 ， 首 部 中 的 协议 字段 会 
被 设置 为 调用 socket() 函 数 时 传递 给 它 的 protocol 字段 。 当 开启 IP_HDRINCL 时 ,我 们 可 以 从 IP 
首部 第 一 个 字 节 开始 构造 整个 IP 报 文 , 其 中 IP 首部 中 的 标识 字段 和 校 验 和 字段 总 是 内 核 自 己 维护 
的 ， 开 启 IP_HDRINCL 的 模板 代码 如 下 : 

const int on = 1; 

if(setsockopt(fd,SOL IP,IP HDRINCL,&on,sizeof(int)) « 0) 

{ 


printf("set socket option error!\n"); 
| 


下 面 的 代码 创建 了 一 个 网 络 层 的 原始 套 接 字 : 
Socket(AF INET, SOCK RAW, IPPROTO TCP|IPPROTO UDP|IPPROTO ICMP); 


该 套 接 字 可 以 接收 协议 类 型 为 TCP、UDP、ICMP 等 发 往 本 机 的 IP 数据 包 ， 但 不 能 收 到 不 是 
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发 往 本 地 IP 的 数据 包 (IP 软 过 滤 会 丢弃 这 些 不 是 发 往 本 机 IP 的 数据 包 ) ， 而 且 不 能 收 到 从 本 机 发 
送出 去 的 数据 包 。 发 送 时 需要 自己 组 织 TCP、UDP、ICMP 等 头 部 ， 可 以 使 用 setsockopt 来 自己 包 


装 IP 头 部 。 


面向 TP. 层 的 原始 套 接 字 的 常用 编程 函数 和 链 路 层 的 原始 套 接 字 函数 相同 ， 这 里 就 不 再 资 述 。 


下 面 来 看 实例 。 


【 例 15.12】 获 取 网 卡 IP 地 址 信息 ( 原始 套 接 字 版 ) 
(1) 打开 UE， 输 入 代码 如 下 : 


#include 
#include 
#include 
#include 
#include 
#include 
#include 


<string.h> 
<sys/socket.h> 
«sys/ioctl.h» 
«net/if.h» 
<stdio.h> 
<netinet/in.h> 
<arpa/inet.h> 


int main() 


( 


int inet sock; 
struct ifreq ifr; // 定 义 网 口 请 求 结构 体 
inet sock = socket(AF INET, SOCK RAW, IPPROTO TCP); 
strcpy(ifr.ifr name, "enol6777736"); 
//SIOCGIFRADDR 标 志 代表 获取 接口 地 址 
if (ioctl(inet sock, SIOCGIFADDR, &ifr) < 0) 
perror("ioctl"); 
printf("$sWin", inet ntoa(((struct 
sockaddr in*)&(ifr.ifr addr))-»sin addr)); 
return 0; 


) 


代码 中 ， 首 先 创 建 一 个 原始 套 接 字 ， 然 后 把 本 机 的 一 个 网 卡 名 字 “eno16777736” 赋 值 给 
ifrifr _ name， 接着 调用 ioctl 函数 获取 SIOCGIFADDR 信息 ， 即 网 络 接口 的 IP 地 址 信息 。 


(2) 上 传 到 Linux， 然 后 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 
[rootélocalhost test]# ./test 


el 


该 全 是 笔者 CentOS 7 的 eno16777736 网 卡 的 IP 地址 。 


【 例 15.13】 实 现 简单 的 ping 功能 
(1) 打开 UE， 输 入 代码 如 下 : 


#include 
#include 
#include 
#include 


<stdio.h> 
<stdlib.h> 
<string.h> 
<errno.h> 
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#include <sys/socket.h> 
#include <sys/types.h> 
#include <netinet/in.h> 
#include «arpa/inet.h» 
#include <netdb.h> 

#include <sys/time.h> 
#include <netinet/ip icmp.h> 
#include <unistd.h> 

#include <signal.h> 


#define MAX SIZE 1024 


char send buf[MAX SIZE]; 
char recv buf[MAX SIZE]; 
int nsend = 0, nrecv = 0; 
int datalen - 56; 


// 统 计 结果 
void statistics(int signum) 
{ 
printf ("yne PING statistics--------------- Nnn)i7 
printf("$d packets transmitted,$d recevid,$$$d lostWn", nsend, nrecv, 
(nsend - nrecv) / nsend * 100); 
exit(EXIT SUCCESS); 


// 校 验 和 算法 


int calc chsum(unsigned short *addr, int len) 


int sum = 0, n = len; 
unsigned short answer - 0; 
unsigned short *p - addr; 


// 每 两 个 字 节 相 加 
while (n > 1) 
t 
sum += *p++; 
n -= 2; 


} 


// 处 理 数据 大 小 是 奇数 ， 在 最 后 一 个 字 节 后 面 补 0 

if (n == 1) 

t 
*((unsigned char *)&answer) - *(unsigned char *)p; 
sum += answer; 


5 
// 将 得 到 的 sum 值 的 高 2 字 节 和 低 2 字 节 相 加 


sum = (sum >> 16) + (sum & Oxffff); 


// 处 理 溢出 的 情况 
sum += sum >> 16; 
answer = ~sum; 
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return answer; 


int pack(int pack num) 


int packsize; 
struct icmp *icmp; 
struct timeval *tv; 


icmp = (struct icmp *)send buf; 
icmp-»icmp type = ICMP ECHO; 
icmp-»icmp code - 0; 

icmp-»icmp cksum = 0; 

icmp-»icmp id = htons(getpid()); 
icmp-»icmp seq = htons (pack num); 


tv = (struct timeval *)icmp-»icmp data; 
// 记 录 发 送 时 间 

if (gettimeofday(tv, NULL) < 0) 

t 


perror("Fail to gettimeofday"); 
return -1; 


) 


packsize = 8 + datalen; 
icmp-»icmp cksum = calc chsum((unsigned short *)icmp, packsize); 


return packsize; 


int send packet(int sockfd, struct sockaddr *paddr) 
int packsize; 


// 将 send buf 填 上 a 
memset(send buf, 'a', sizeof(send buf)); 


nsend*t; 
// 打 icmp 包 


packsize = pack(nsend); 
if (sendto(sockfd, send buf, packsize, 0, paddr, sizeof(struct sockaddr)) 


t 
perror("Fail to sendto"); 
return -1; 


) 


return 0; 


l 
struct timeval time sub(struct timeval *tv send, struct timeval *tv recv) 


t 
struct timeval ts; 
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) 


if (tv recv-»tv usec - tv send->tv usec < 0) 
t 

tv recv-»tv sec--; 

tv recv->tv usec += 1000000; 


) 


ts.tv sec = tv recv->tV sec - tv send->tv sec; 
ts.tv usec = tv recv-»tv usec - tv send-^tv usec; 


return ts; 


int unpack(int len, struct timeval *tv recv, struct sockaddr *paddr, char 


*ipname) 


( 


) 


struct ip *ip 7 

struct icmp *icmp ; 
struct timeval *tv send, 
ts ; 

int ip head len ; 

float rtt ; 


ip = (struct ip *)recv buf ; 
ip head len = ip->ip hl << 2 ; 
icmp = (struct icmp *) (recv buf + ip head len) ; 


len -= ip head len ; 

if(len « 8) 

t 
printf("ICMP packetsV's is less than 8.\n") ; 
return - 1 ; 


) 


if(ntohs(icmp-»icmp id) == getpid() && icmp-»icmp type == ICMP ECHOREPLY) 
t 
nrecvtt ; 
tv send = (struct timeval *)icmp-^icmp data ; 
ts - time sub(tv send, tv recv) ; 
rtt = ts.tv sec * 1000 + (float)ts.tv usec / 1000 ;// 以 毫秒 为 单位 
printf("$d bytes from $s ($s):icmp req = $d ttl-$d time-$.3fms. Wn", 
len, 
ipname, 
inet ntoa(((struct sockaddr in *)paddr)-»^sin addr), 
ntohs(icmp-»icmp seq), 
ap-orpatti 
rtt) ; 
) 


return 0 ; 


int recv packet(int sockfd, char *ipname) 


t 
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socklen t addr len, 

n; 

struct timeval tv ; 

struct sockaddr from addr ; 


addr len - sizeof(struct sockaddr) ; 
if((n = recvfrom(sockfd, recv buf, sizeof(recv buf), 0,&from addr, 
&addr len)) < 0) 
t 
perror("Fail to recvfrom") ; 
return - 1 ; 


) 


if(gettimeofday(&tv, NULL) « 0) 

t 
perror("Fail to gettimeofday") ; 
return - 1 ; 


) 


unpack(n, &tv, &from addr, ipname) 


return 0 ; 


int main(int argc, char *argv[]) 
t 
int size = 50 * 1024 ; 
int sockfd, 
netaddr ; 
struct protoent *protocol ; 
struct hostent *host ; 
struct sockaddr in peer addr ; 


人 

t 
fprintf (stderr, "usage : $s ip. Mn", argv[0]) ; 
exit(EXIT FAILURE) ; 

) 


// 获 取 icmp 的 信息 
if((protocol = getprotobyname ("icmp")) == NULL) 
j! 
perror("Fail to getprotobyname") ; 
exit (EXIT FAILURE) ; 
} 


// 创 建 原始 套 接 字 
if((sockfd = socket (AF INET, SOCK RAW, protocol->p proto)) < 0) 


{ 
perror("Fail to socket") ; 
exit(EXIT FAILURE) ; 
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// 回 收 root 权 限 ， 设 置 当前 用 户 权限 
setuid(getuid()) ; 


// 扩 大 套 接 字 接 收 缓冲 区 到 50KB《〈 见 size 的 定义 ) ， 这 样 做 主要 是 为 了 减少 接收 缓冲 区 溢出 的 可 能 性 


if(setsockopt(sockfd, SOL SOCKET, SO RCVBUF, &size, sizeof(size)) < 0) 
t 

perror("Fail to setsockopt") ; 

exit(EXIT FAILURE) ; 


) 
// 填 充 对 方 的 地 址 


bzero(&peer addr, sizeof (Peer addr)) 


peer addr .sin family = AF INET ; 
// 判 断 是 主机 名 (域名 ) 还 是 ip 


if((netaddr = inet addr(argv[1])) == INADDR NONE) 


// 是 主机 名 (域名) 

if((host = gethostbyname (argv[1])) == NULL) 
{ 

fprintf(stderr, "$s unknown host 


exit(EXIT FAILURE) 
) 


: $s.Mn", argv[0], argv[1]) ; 


memcpy((char *)&peer addr.sin addr, host->h addr, host->h length) 


)else {//ip 地 址 
peer addr.sin addr.s addr = netaddr ; 


) 


了 


// 注 册 信 号 处 理 函 数 
Signal(SIGALRM, statistics) 
Signal(SIGINT, statistics) 
alarm(5) ; 


; 


; 


// 打 印 开始 信息 


printf("PING $s($s) $d bytes of data.\n", argv[1], 
inet ntoa(peer addr.sin addr), datalen) ; 


// 发 送 包 文 和 接收 报 文 
while(1) 
t 
send packet(sockfd, (struct sockaddr *)&peer addr) ; 


recv packet(sockfd, argv[1]) 
alarm(5) ; 


sleep(1) ; 


) 


exit(EXIT SUCCESS) ; 
) 


在 代码 中 ， 主 要 实现 了 ICMP 的 一 些 协议 ， 如 果 不 熟 悉 














， 可 以 参考 前 面 第 11 章 的 内 容 ， 对 于 
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ICMP 协议 讲述 得 相当 详细 ， 大 家 可 以 和 代码 结合 起 来 看 ， 必 定 有 所 收获 。 


ping (packet internet groper) 命令 通常 用 来 测试 本 机 与 目标 主机 的 连通 性 。Linux 和 Windows 
都 提供 了 此 命令 ， 但 两 者 也 有 不 同 之 处 ， 比 如 Linux 下 的 ping 不 会 自动 终止 ， 需 要 按 Ctrl+C 键 终 
止 或 者 用 参数 -c 指定 要 求 完 成 的 回应 次 数 。 基 本 工作 原理 是 向 网 络 上 的 目标 主机 发 送 ICMP 报 文 ， 
如 果 目 标 主机 收 到 报 文 ， 则 把 报 文 原样 传 回 给 源 主机 。 向 目标 主机 发 送 的 ICMP 数据 包 被 称 为 
echo_request( 回 声 _ 请 求 ) 包 ， 而 之 后 被 返回 的 数据 包 则 叫 作 echo response (回声 _ 响 应 〉。 


这 里 的 ping 程序 使 用 的 格式 为 : Jtest ip. 
(2) 保存 代码 为 test.cpp， 然 后 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test 


[root@localhost test]# ./test 1.1.1.1 
bytes of data. 
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16.1 iPerf 概述 


iPerf 是 美国 伊利 诺 斯 大 学 (University of Illinois) 开发 的 一 种 网 络 性 能 测试 工具 ， 可 以 用 来 测 
试 网 络 节点 间 TCP 或 UDP 连接 的 性 能 , 包括 带宽 、 延 时 拌 动 Gitter, 适用 于 UDP) 以 及 误 码 率 ( 适 
用 于 UDP) 等 。iPerf 工 具 对 学 习 C++ 编程 和 网 络 编程 具有 相当 重要 的 借鉴 意义 。 学 习 一 定 不 能 闭 
门 造 车 ， 要 学 习 各 种 优秀 的 开源 工具 。 

iPerf 开始 出 现 的 时 候 是 在 2003 年 ,最 初 的 版 本 是 1.7.0, 该 版 本 使 用 C++ 编写 , 后面 到 了 iPerf2 
版 本 ， 是 C++ 和 C 结合 编写 的 ， 现 在 一 个 法 国人 团队 另起炉灶 ， 重 构 出 了 不 向 下 兼容 的 iPerf3 。 
C++ 开发 者 要 学 习 iPerf 源 代码 ， 最 好 用 1.7.0 版 本 。iPerf 的 官方 网 站 地 址 为 :https://iperf.fr/， 源 代 
码 可 以 在 上 面 下 载 。 


16.2 iPerf 的 特点 


iPerf 有 以 下 特点 : 


(1) 开源 ， 每 个 版 本 的 源 代码 都 能 进行 下 载 和 学 习 。 

(2) 跨 平 台 ， 支 持 Windows、Linux、MacOS、Android 等 主流 平台 。 

(3) 支持 TCP、UDP 协议 ， 包 括 IPV4 和 IPV6， 最 新 的 iPerf 还 支持 SCTP 协议 。 如 果 使 用 
TCP 协议 ，iPerf 可 以 测试 网 络 带宽 、 报 告 MSS( 最 大 报 文 段 长 度 ) 和 MTU (最 大 传输 单元 ) 的 大 
小 ,支持 通过 套 接 字 缓冲 区 修改 TCP 窗口 大 小 ， 支 持 多 线程 并 发 。 如 果 使 用 UDP 协议 ， 客 户 端 可 
创建 指定 大 小 的 带宽 流 、 统 计数 据 包 丢失 和 延迟 拌 动 率 等 信息 。 


16.3 iPerf 的 工作 原理 


iPerf 是 基于 Server-Client 模式 实现 的 。 在 测量 网 络 参数 时 ，iPerf 区 分 听 者 和 说 者 两 种 角色 。 
说 者 向 听 着 发 送 一 定量 的 数据 ， 由 听 者 统计 并 记录 带宽 、 延 迟 抖动 等 参数 。 说 者 的 数据 全 部 发 送 完 
成 后 ， 听 者 通过 向 说 者 回 送 一 个 数据 包 ， 将 测量 数据 告知 说 者 。 这 样 ， 在 听 者 和 说 者 两 边 都 可 以 显 
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示 记 录 的 数据 。 如 果 网 络 过 于 拥塞 或 误 码 率 较 高 ， 当 听 者 回 送 的 数据 包 无 法 被 说 者 收 到 时 ， 说 者 就 
无 法 显示 完整 的 测量 数据 ， 而 只 能 报告 本 地 记录 的 部 分 网 络 参数 ， 如 发 送 的 数据 量 、 发 送 时 间 、 发 
送 带宽 等 ， 像 延 时 抖动 等 参数 在 说 者 一 侧 则 无 法 获得 。 

iPerf 提供 3 种 测量 模式 : normal、tradeoff、dualtest。 对 于 每 一 种 模式 ,用 户 都 可 以 通过 -P 选 
项 指定 同时 测量 的 并 行 线程 数 。 下 面 假设 用 户 设 定 的 并 行 线程 数 为 P 个 。 

在 normal 模式 下 ，Client 生成 P 个 说 者 线程 ， 并 行 向 Server 发 送 数据 。Server 每 接收 到 一 个 
说 者 的 数据 ， 就 生成 一 个 听 者 线程 ， 负 责 与 该 说 者 间 的 通信 。Client 有 P 个 并 行 的 说 者 线程 ， 而 
Server 端 有 了 个 并 行 的 听 者 线程 (针对 这 一 Client) ， 两 者 之 间 共 有 了 个 连接 同时 收发 数据 。 测 量 
结束 后 ，Server 端的 每 个 听 者 向 自己 对 应 的 说 者 回 送 测 得 的 网 络 参数 。 

在 tradeo 任 模式 下 , 首先 进行 normal 模式 下 的 测量 过 程 。 然 后 Server 和 Client 互 换 角色 。Server 
生成 P 个 说 者 ， 同 时 向 Client 发 送 数据 。Client 对 应 每 个 说 者 生成 一 个 听 者 接收 数据 并 测量 参数 。 
最 后 由 Client 端的 听 者 向 Server 端的 说 者 回馈 测量 结果 。 这 样 就 可 以 测量 两 个 方向 上 的 网 络 参数 了 。 

dualtest 模式 同样 可 以 测量 两 个 方向 上 的 网 络 参 数 ， 与 tradeo 任 模式 的 不 同 在 于 ， 在 dualtest 模 
式 下 ， 由 Server 到 Client 方向 上 的 测量 与 由 Client 到 Server 方向 上 的 测量 是 同时 进行 的 。Client 
生成 P 个 说 者 和 了 个 听 者 ， 说 者 向 Server 端 发 送 数 据 ， 听 者 等 待 接收 Server 端的 说 者 发 来 的 数据 。 
Server 端 也 进行 相同 的 操作 。 在 Server 端 和 Client 端 之 间 同 时 存在 2P 个 网 络 连接 ， 其 中 有 了 个 连 
接 的 数据 由 Client 流向 Server， 另 外 P 个 连接 的 数据 由 Server 流向 Client。 因 此 ，dualtest 模式 需要 
的 测量 时 间 是 tradeoff 模式 的 一 半 。 

在 3 种 模式 下 ,除了 P 个 听 者 或 说 者 进程 外 ， 在 Server 和 Client 两 侧 均 存 在 一 个 监控 线程 

(monitor thread) 。 监 控 线程 的 作用 包括 : 


COD. 生成 说 者 或 听 者 线程 。 
(2) 同步 所 有 说 者 或 听 者 的 动作 〈 开 始 发 送 、 结 束 发 送 等 ) 。 
(3) 计算 并 报告 说 有 说 者 或 听 者 的 累计 测量 数据 。 


在 监控 线程 的 控制 下 ， 所 有 P 个 线程 间 都 可 以 实现 同步 和 信息 共享 。 说 者 线程 或 听 者 线程 向 
一 个 公共 的 数据 区 写 入 测量 数据 (此 数据 区 位 于 实现 监控 线程 的 对 象 中 ), 由 监控 线程 读 取 并 处 理 。 
通过 互 斥 锁 (mutex) 实现 对 该 数据 区 的 同步 访问 。 

Server 可 以 同时 接收 来 自 不 同 Client 的 连接 ， 这些 连 接 是 通过 Client 的 IP 地 址 标识 的 。Server 
将 所 有 Client 的 连接 信息 组 织 成 一 个 单 向 链表 ， 每 个 Client 对 应 链表 中 的 一 项 ， 该 项 包含 该 Client 
的 地 址 结构 (sockaddr〉 以 及 实现 与 该 Client 对 应 的 监控 线程 的 对 象 我 们 称 它 为 监控 对 象 ) ， 所 
有 与 此 Client 相关 的 听 者 对 象 和 说 者 对 象 都 是 由 该 监控 线程 生成 的 。 





16.4 iPerf 的 主要 功能 


对 于 TCP， 有 以 下 几 个 主要 功能 : 


(1) 测量 网 络 带宽 。 
(2) 报告 MSS/MTU 值 的 大 小 和 观测 值 。 
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(3) 支持 TCP 窗口 值 通过 套 接 字 缓 冲 。 
(4) 当 P 线程 或 Win32 线程 可 用 时 ， 支 持 多 线程 。 客 户 端 与 服务 端 支持 同时 多 重 连接 。 


对 于 UDP， 有 以 下 几 个 主要 功能 : 





(1) 客户 端 可 以 创建 指定 带宽 的 UDP 流 。 

(2) WEZE. 

(3) 测量 延迟 。 

(4) 支持 多 播 。 

(5) 25 pP 线程 可 用 时 ， 支 持 多 线程 。 客 户 端 与 服务 端 支持 同时 多 重 连接 (不 支持 Windows) 。 


其 他 功能 : 


(1) 在 适当 的 地 方 ， 选 项 中 可 以 使 用 K 和 M。 例如 ，131072 字 节 可 以 用 128K RE. 
(2) 可 以 指定 运行 的 总 时 间 ， 甚 至 可 以 设置 传输 的 数据 总 量 。 

(3) 在 报告 中 ， 为 数据 选用 最 合适 的 单位 。 

(4) 服务 器 支持 多 重 连接 ， 而 不 是 等 待 一 个 单线 程 测试 。 

(5) 在 指定 时 间 间 隔 重 复 显示 网 络 带 宽 、 波 动 和 丢 包 情况 。 

(6) 服务 器 端 可 作为 后 台 程 序 运行 。 

(7) 服务 器 端 可 作为 Windows 服务 运行 。 

(8) 使 用 典型 数据 流 来 测试 链接 层 压缩 对 于 可 用 带宽 的 影响 。 

(9) 支持 传送 指定 文件 ， 可 以 定性 和 定量 测试 。 


16.5 在 Linux 下 安装 iPerf 


对 于 Linux， 可 以 登录 官网 (https://iperf.fr/iperf-download.php#source) ， 然 后 下 载 1.7.0 版 本 
的 安装 程序 (iperf-1.7.0-source.tar.gz) ， 使 用 下 列 命令 进行 安装 : 

[root@localhost iperf-1.7.0]# tar -zxvf iperf-1.7.0-source.tar.gz 

[rootélocalhost soft]# cd iperf-1.7.0/ 


[rootülocalhost soft]#make 
[rootelocalhost soft]#make install 


先 解压 ， 然 后 编译 和 安装 。 
安装 完毕 后 ， 在 命令 行 下 可 以 直接 输入 iPerf 命令 ， 比 如 查看 帮助 : 
[root@localhost iperf-1.7.0]# iperf -h 


Usage: iperf [-s|-c host] [options] 
iperf [-h|--help] [-v|--version] 


Client/Server: 
—t, —format [kmKM] format to report: Kbits, Mbits, KBytes, MBytes 
-i, --interval # seconds between periodic bandwidth reports 
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bee=Lon #[KM] length of buffer to read or write (default 8 KB) 
-m, --print mss print TCP maximum segment size (MTU - TCP/IP header) 
=p, ==port + server port to listen on/connect to 

-üp udp. use UDP rather than TCP 

-w, --window # [KM] TCP window size (socket buffer size) 

-B, --bind <host> bind to «host», an interface or multicast address 
-C, --compatibility for use with older versions does not sent extra msgs 
-M, --mss * set TCP maximum segment size (MTU - 40 bytes) 

-N, --nodelay set TCP no delay, disabling Nagle's Algorithm 

-V, --IPv6Version Set the domain to IPv6 


Server specific: 
-s, --server run in server mode 
-D, --daemon run the server as a daemon 


Client specific: 
-b, --bandwidth # [KM] for UDP, bandwidth to send at in bits/sec 
(default 1 Mbit/sec, implies -u) 
-CA --client <host> run in client mode, connecting to «host» 


-d, --dualtest Do a bidirectional test simultaneously 

=N num: # [KM] number of bytes to transmit (instead of -t) 

-r, --tradeoff Do a bidirectional test individually 

-t, --time * time in seconds to transmit for (default 10 secs) 

-F, --fileinput «name» input the data to be transmitted from a file 

=I; —-stdin input the data to be transmitted from stdin 

-L, --listenport # port to recieve bidirectional tests back on 

-P, --parallel f£ number of parallel client threads to run 

-T EET + time-to-live, for multicast (default 1) 
Miscellaneous: 

-h, --help print this message and quit 

-v, --version print version information and quit 


[KM] Indicates options that support a K or M suffix for kilo- or mega- 
The TCP window size option can be set by the environment variable 

TCP WINDOW SIZE. Most other options can be set by an environment variable 
IPERF «long option name», such as IPERF BANDWIDTH. 


Report bugs to «dastenlanr.net» 


说 明 安 装 成 功 了 。 


16.6 iPerf 的 简单 使 用 


在 分 析 源 代码 之 前 , 我 们 需要 学 会 iPerf 的 简单 使 用 。 iPerf 是 一 个 服务 器 /客户 端 运行 模式 的 程 
序 。 因 此 使 用 的 时 候 ， 需 要 在 服务 器 端 运行 iPerf， 也 需要 在 客户 端 运行 iPerf。 简 单 的 网 络 拓扑 图 
如 图 16-1 所 示 。 
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IPerf 客户 端 IPerf 服务 端 


1Pz1.1.1.2 






运行 命令 : iperf -c 1.1.1.2 


图 16-1 


右边 是 服务 端 ， 在 命令 行 下 使 用 iperf 加 参数 -s， 左 边 是 客户 端 ， 运 行 时 加 上 -c 和 服务 器 的 IP 


地 址 。iPerf 通过 选项 -c 和 -s 决定 其 当前 是 作为 客户 端 程序 还 是 作为 服务 端 程序 运行 ， 当 作为 客户 
端 程序 运行 时 ，-c 后 面 必 须 带 所 连接 对 端 服务 器 的 IP 地 址 或 域名 。 经 过 一 段 测试 时 间 (默认 为 10 
秒 ) 后 ， 在 Server 端 和 Client 端 就 会 打印 出 网 络 连接 的 各 种 性 能 参数 。iPerf 作为 一 种 功能 完备 的 
测试 工具 ， 还 提供 了 各 种 选项 ， 例 如 建立 TCP 连接 还 是 UDP 连接 、 测 试 时 间 、 测 试 应 传输 的 字 节 
总 数 、 测 试 模式 等 。 而 测试 模式 又 分 为 单项 测试 (Normal Test) 、 同 时 双向 测试 (Dual Test) 和 交 
蔡 双 向 测试 (Tradeoff Test) 。 此 外 ， 用 户 可 以 指定 测试 的 线程 数 。 这 些 线程 各 自 独立 完成 测试 ， 





并 可 报告 各 自 的 以 及 汇总 的 统计 数据 。 我 们 可 以 用 虚拟 机 软件 VMware 来 模拟 两 台 主 机 ,在 VMware 


下 建立 两 个 Linux 操作 系统 即 可 ， 并 且 确 保 能 互相 ping 通 ， 而 且 要 关闭 两 端 防火 墙 : 


[root@localhost iperf-1.7.0]# firewall-cmd --state 
running 

[root@localhost iperf-1.7.0]# systemctl stop firewalld 
[rootQlocalhost iperf-1.7.0]4$ firewall-cmd --state 
not running 


其 中 , firewall-cmd --state 用 来 查看 防火 墙 的 当前 运行 状态 ,systemctl stop firewalld 用 来 关闭 防 


JG 


具体 使 用 iPerf 的 时 候 ， 一 台 当 作 服 务 器 ， 另 一 台 当 作客 户 机 。 在 服务 器 端 输入 命令 ; 


[root@localhost iperf-1.7.0]# iperf -s 


Server listening on TCP port 5001 
TCP window size: 85.3 KByte (default) 


此 时 服务 器 就 处 于 监听 等 待 状态 了 。 接 着 在 客户 端 输入 命令 : 
[root@localhost iperf-1.7.0]# iperf -c 1.1.1.2 


Kp, 1.1.1.2 是 服务 端的 了 P 地 址 。 


16.7 iPerf 源 代码 概述 





iPerf 是 用 C++ 语言 实现 的 , 对 设计 中 的 各 种 结构 和 功能 单元 都 按照 面向 对 象 的 思想 进行 建 模 。 


它 主要 用 到 Linux 系统 编程 中 两 个 主要 的 部 分 :Socket 网 络 编程 和 多 线程 编程 .因此 ,通过 分 析 iPerf 
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的 源 代码 , 我们 就 可 以 在 实际 的 例子 中 学 习 面 向 对 象 编程 ,Socket 网 络 编程 以 及 多 线程 编程 的 技术 。 
同时 ，iPerf 实现 的 功能 比较 简单 ， 代 码 并 不 复杂 。 因 此 ，iPerf 是 我 们 研究 Linux 系统 编程 技术 的 
一 个 很 好 的 学 习 对 象 。 

这 里 我 们 分 析 的 是 1.7.0 版 本 的 源 代码 。 值 得 注意 的 是 ，iPerf 的 源 代码 中 既 包 含 对 应 于 UNIX 
的 部 分 ， 也 包含 对 应 于 Windows 的 部 分 。 这 两 部 分 是 通过 条 件 编译 的 预 处 理 语句 分 别 编译 的 。 下 
面 仅 对 UNIX 部 分 的 代码 进行 分 析 。 
在 开发 iPerf 的 过 程 中 , 开发 者 把 Socket 编程 和 多 线程 编程 中 经 常用 到 的 一 些 系统 调用 封装 成 
对 象 ， 屏蔽 了 底层 函数 的 复杂 接口 , 提供 了 模块 化 和 面向 对 象 的 机 制 ， 也 提供 了 一 些 非常 实用 的 编 
FLR, 我 们 可 以 在 实现 自己 的 程序 时 复 用 这 些 类 。 由 于 这 些 类 实现 的 源 代码 都 比较 简单 ， 因此 为 
我 们 修改 前 人 的 代码 实现 自己 的 功能 提供 了 方便 。 

这 些 类 的 定义 与 实现 都 在 源 代码 文件 夹 的 lib 子 文件 夹 下 。 主 要 包括 以 下 一 些 对 象 。 








€  SocketAddr X: 封装 了 Socket 接口 中 的 网 络 地 址 结构 (sockaddr in 等 ) 以 及 各 种 地 
址 转换 的 系统 调用 ( gethostbyname、gethostbyaddr、inet_ntop 等 ) 。 
€ Socket 类 : 封装 了 socket 文件 描述 符 ， 以 及 socket、listen、connect 等 系统 调用 。 
€  Mutex 类 以 及 Condition 类 : 封装 了 POSIX 标准 中 的 mutex 和 condition (条 件 变 量 ) 
线程 同步 机 制 。 
€ Thread 类 : 封装 了 POSIX 标准 中 的 多 线程 机 制 ， 提 供 了 一 种 简单 易 用 的 线程 模型 。 
€ Timestamp 类 : 通过 UNIX 系统 调用 gettimeofday 实现 了 一 个 时 间 鹤 对 象 ， 提 供 了 获 
得 当前 时 间 稚 、 计 算 两 个 时 间 鹤 之 间 的 先后 关系 等 方法 。 
此 外 , TE lib 文件 夹 中 还 包括 一 些 iPerf 的 实现 提供 的 实用 工具 函数 , 包括 endian.c 文件 中 的 字 
节 序 转换 函数 、gnu_getopt 文件 中 的 命令 行 参数 处 理 函 数 、snprintf 文件 中 的 字符 串 格式 化 函数 、 
signal.c 文件 中 的 与 信号 处 理 有 关 的 函数 、string.c 文件 中 的 字符 处 理 函 数 、tcp_window_size.c 文件 
中 的 TCP 窗口 大 小 处 理 函 数 等 。 


16.8 Thread 类 


Thread 类 封装 了 POSIX 标准 中 的 多 线程 机 制 ， 提 供 了 一 种 简单 易 用 的 线程 模型 。Thread 类 是 
iPerf 实现 中 比较 重要 的 类 ， 是 iPerf 实现 多 线程 并 行 操作 的 核心 。 
Thread 类 的 定义 在 文件 lib/Thread.hpp 中 ， 其 实现 位 于 lib/Thread.cpp 中 。 


/* 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 */ 
class Thread { 
public: 

Thread( void ); 

virtual -Thread(); 

// start or stop a thread executing 

void Start( void ); 

void Stop( void ); 


* 610* 
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// run is the main loop for this thread 
// usually this is called by Start(), but may be called 
// directly for single-threaded applications. 
virtual void Run( void ) - 0; 
// wait for this or all threads to complete 
void Join( void ); 
static void Joinall( void ); 
void DeleteSelfAfterRun( void ) ( 
mDeleteSelf - true; 
) 
// set a thread to be daemon, so joinall won't wait on it 
void SetDaemon( void ); 
// returns the number of user (i.e. not daemon) threads 
static int NumUserThreads( void ) ( 
return sNum; 
) 
static nthread t GetID( void ); 
static bool EqualID( nthread t inLeft, nthread t inRight ); 
Static nthread t ZeroID( void ); 
protected: 
nthread t mTID; 
bool mDeleteSelf; 
// count of threads; used in joinall 
static int sNum; 
static Condition sNum cond; 
private: 
// low level function which calls Run() for the object 
// this must be static in order to work with pthread create 
static void* Run Wrapper( void* paramPtr ); 
); // end class Thread 


16.8.1 数据 成 员 说 明 
mTID 记录 本 线程 的 线程 ID。 


mDeleteSelf 通过 方法 DeleteSelfA fterRun 设置 来 说 明 是 否 在 线程 结束 后 释放 属于 该 现 程 的 变量 。 
sNum 是 一 个 静态 变量 ， 即 为 所 有 的 Thread 实例 所 共有 。 该 变量 记录 所 生成 的 线程 的 总 数 。 


Thread 对 象 的 Joinall 方法 通过 该 变量 判断 所 有 的 Thread 实例 是 否 执行 结束 。 
sNum cond 用 来 同步 对 sNum 操作 的 条 件 变量 ， 也 是 一 个 静态 变量 。 


16.8.2 ERARA 


1. Start 方法 
该 方法 的 代码 如 下 : 


y OO 


* Start the object's thread execution. Increments thread 
* count, spawns new thread, and stores thread ID. 
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void Thread::Start( void ) ( 
if ( EqualID( mTID, ZeroID() ) ) { 
// increment thread count 
sNum cond.Lock(); 
sNumtt; 
sNum cond.Unlock(); 
Thread* ptr = this; 
// pthreads -- spawn new thread 
int err - pthread create( &mTID, NULL, Run Wrapper, ptr ); 
FAIL( err !- 0, "pthread create" ); 
) 
) // end Start 


该 函数 首先 通过 Num++ 记 录 一 个 新 线程 的 产生 , 之 后 通过 pthread. create 系统 调用 产生 一 个 新 
线程 。 新 线程 执行 Run_Wrapper 函数 ， 并 把 ptr 指针 作为 参数 。 原 线程 在 判断 pthread_create 是 否 
成 功 后 退出 Start 函数 。 


2. Stop 方法 
该 方法 的 代码 如 下 : 


/* 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
* Stop the thread immediately. Decrements thread count and 
* resets the thread ID. 


void Thread::Stop( void ) ( 
if ( ! EqualID( mTID, ZeroID() ) ) ( 

// decrement thread count 

sNum cond.Lock(); 

sNum--; 

sNum cond.Signal(); 

sNum cond.Unlock(); 

nthread t oldTID - mTID; 

mTID = ZeroID(); 

// exit thread 

// use exit() if called from within this thread 

// use cancel() if called from a different thread 

if ( EqualID( pthread self(), oldTID ) ) ( 
pthread exit( NULL ); 

y else { 
// Cray J90 doesn't have pthread cancel; Iperf works okay without 
pthread cancel( oldTID ); 

} 

} 
) // end Stop 


函数 首先 通过 sSNum-- 记 录 一 个 线程 执行 结束 ， 并 通过 sNum cond 的 Signal 方法 激活 wait TE 
sNum cond 的 线程 〈 某 个 主线 程 会 调用 Joinall 方法 ， 等 待 全 部 线程 的 结束 ， 在 Joinall 方法 中 通过 
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sNum cond.Wait()/E SNum_cond 条 件 变量 上 等 待 ) 。 若 结束 的 线程 是 自身 ， 则 调用 pthread exit PK 
数 结束 ， 和 否则 调用 pthread cancel 函数 。 注 意 : 传统 的 exit 函数 会 结束 整个 进程 ( 即 该 进程 的 全 部 
线程 ) 的 运行 ， 而 pthread_exit 函数 仅 结束 该 线程 的 运行 。 


3. Run_Wrapper 方 法 


该 方法 的 代码 如 下 : 

/* -------------------2---2-2-2-2-2--2-2-2-2-2-2-2-2-2-2-2-2-2--2---2--2-2-2-2-2-----2-2-2-------------- 
* Low level function which starts a new thread, called by 

* Start(). The argument should be a pointer to a Thread object. 

* Calls the virtual Run() function for that object. 

* Upon completing, decrements thread count and resets thread ID. 
* If the object is deallocated immediately after calling Start(), 
* such as an object created on the stack that has since gone 

* out-of-scope, this will obviously fail. 

* [static] 

* =- 





void* 
Thread::Run Wrapper( void* paramPtr ) { 
assert( paramPtr !- NULL ); 
Thread* objectPtr - (Thread*) paramPtr; 
// run (pure virtual function) 
objectPtr-»Run(); 
#ifdef HAVE POSIX THREAD 
// detach Thread. If someone already joined it will not do anything 
// If noone has then it will free resources upon return from this 
// function (Run Wrapper) 
pthread detach (objectPtr-»mTID); 
#endif 
// set TID to zero, then delete it 
// the zero TID causes Stop() in the destructor not to do anything 
objectPtr-»mTID = ZeroID(); 
if ( objectPtr-»mDeleteSelf ) ( 
DELETE PTR( objectPtr ); 
} 
// decrement thread count and send condition signal 
// do this after the object is destroyed, otherwise NT complains 
sNum cond.Lock(); 
sNum--; 
sNum cond.Signal(); 
sNum cond.Unlock(); 
return NULL; 
) // end run wrapper 


该 方法 是 一 个 外 包 函 数 (wrapper), 其 主要 功能 是 调用 本 实例 的 Run Z7 X. KERE, Run. Wrapper 
是 一 个 静态 成 员 函 数 ,是 为 所 有 的 Thread 实例 所 共有 的 ,因此 无 法 使 用 this 指针 .调用 Run_Wrapper 
的 Thread 通过 参数 paramPtr 指明 具体 的 Thread 实例 。 在 Run 返回 之 后 ， 通 过 pthread detach 使 该 
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线程 在 运行 结束 以 后 可 以 释放 资源 。Joinall 函数 通过 监视 sNum 的 数值 等 待 所 有 线程 运行 结束 ， 而 
并 非 通过 pthread join 函数 。 在 完成 清理 工作 后 ，Run_ Wrapper 减少 sNum 的 值 ， 并 通过 
sNum cond.Signal 函数 通知 在 Joinall 中 等 待 的 线程 。 

4. Run 方法 

从 Run 方法 的 声明 中 知道 ， 该 方法 是 一 个 纯 虚 函数 ， 因 此 Thread 是 一 个 抽象 基 类 ， 主 要 作用 
是 为 其 派生 类 提供 统一 的 对 外 接口 。 在 Thread 的 派生 类 中 , iPerf 中 的 Server、Client、Speader、 
Audience. Listener 等 类 都 会 为 Run 提供 特定 的 实现 ， 以 完成 不 同 的 功能 ， 这 是 对 面向 对 象 设 计 多 
态 特 性 的 运用 。Thread 函数 通过 Run 方法 提供 了 一 个 通用 的 线程 接口 。 大 家 可 以 想 一 下 ， 为 什么 
要 通过 Run Wrapper 函数 间接 地 调用 Run 函数 呢 ? 首先 ，Thread 的 各 派生 类 完成 的 功能 不 同 ， 但 
它们 都 是 Thread 的 实例 ， 都 有 一 些 相同 的 工作 要 做 ， 如 初始 化 和 清理 等 。 在 Run Wrapper 中 实现 
这 些 作为 Thread 实例 所 应 有 的 相同 功能 ， 在 Run 函数 中 实现 派生 类 各 自 不 同 的 功能 ， 是 比较 合理 
的 设计 。 

更 重要 的 是 ,由 于 要 通过 Pthread create 函数 调用 Run_Wrapper 函数 ,因此 Run_Wrapper 函数 
必须 是 一 个 静态 成 员 ， 无 法 使 用 this 指针 区 分 运行 Run_Wrapper 函数 的 具体 实例 ， 也 就 无 法 利用 
多 态 的 特性 。 而 这 个 问题 可 以 通过 把 this 指针 作为 Run. Wrapper 函数 的 参数 ， 并 在 Run_Wrapper 
中 显 式 调用 具有 多 态 特性 的 Run 函数 来 解决 。 

这 种 使 用 一 个 wrapper 函数 的 技术 为 我 们 提供 了 一 种 将 C++ 面向 对 象 编 程 和 传统 的 Linux 系统 
调用 相 结合 的 思路 。 


5. Joinall 方法 和 SetDaemon 方法 
其 代码 如 下 : 


/* 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
* Wait for all thread object's execution to complete. Depends on the 
* thread count being accurate and the threads sending a condition 

* signal when they terminate. 

* [static] 











void Thread::Joinall( void ) ( 

sNum cond.Lock(); 

while ( sNum > 0) ( 

sNum cond.Wait(); 

} 

sNum cond.Unlock(); 
) // end Joinall 
/* 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
* set a thread to be daemon, so joinall won't wait on it 
* this simply decrements the thread count that joinall uses, 
* which is not a thorough solution, but works for the moment 


void Thread::SetDaemon( void ) ( 


sNum cond.Lock(); 
sNum--; 
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sNum cond.Signal(); 
sNum cond.Unlock(); 
) 


由 这 两 个 方法 的 实现 可 见 ，Thread 类 是 通过 计数 器 sNum 监视 运行 的 线程 数 的 。 线 程 开始 前 
sNum 加 一 ， 线 程 结束 后 (Stop 方法 和 Run. Wrapper 方法 末尾 ) sNum 减 一 。Joinall 通过 条 件 变量 
类 的 实例 sNum cond 的 Wait 方法 等 待 SNum 的 值 改变 。 而 SetDaemon 的 目的 是 使 调用 线程 不 再 受 
主线 程 Joinall 的 约束 ， 只 是 简单 地 把 sNum 减 一 就 可 以 了 。 


16.9 SocketAddr 类 


SocketAddr 类 定义 在 lib/SocketAddr.hpp 中 ， 实 现在 lib/SocketAddr.cpp 中 。SocketAddr 类 封装 
了 网 络 通信 中 经 常用 到 的 地 址 结构 以 及 在 这 些 结构 上 进行 的 操作 。 地 址 解析 也 是 在 SocketAddr 的 
成 员 函 数 中 完成 的 。 

首先 说 明 一 下 Socket 编程 中 用 于 表示 网 络 地 址 的 数据 结构 。 网 络 通信 中 的 端点 地 址 一 般 可 以 
表示 为 (地 址 艇 ,该 簇 中 的 端点 地 址 ) 。Socket 接口 系统 中 用 来 表示 通用 网 络 地 址 的 数据 结构 是 


sockaddr: 


struct sockaddr (  /* struct to hold an address */ 


u char sa len  /* total length "ur 
u short sa family; /* type of address x 
char sa data[14]; /* value of address 2 


H 


其 中 , sa_family 表示 地 址 所 属 的 地 址 徐 , TCP/IP 协议 的 地 址 簇 用 常量 AF. INET 表示 , 而 UNIX 
命名 管道 的 地 址 簇 用 常量 AF_UNIX 表示 。 

使 用 Socket 的 每 个 协议 簇 都 精确 定义 了 自己 的 网 络 端点 地 址 ， 并 在 头 文件 中 提供 了 相应 的 结 
构 声明 。 用 来 表示 TCP/IP 地 址 的 数据 结构 如 下 : 


struct sockaddr in { 
u char sin len; /* total length */ 
u_short sin family; /* type of address i 
u short sin port; /* protocol port number  */ 
struct in addr sin addr; /* IP address et 
char sin zero[8]; /* unused (set to zero)  */ 
l 


其 中 ，sin_ len. sin family 和 sockaddr 结构 中 的 sa len 以 及 sa. family 表示 相同 的 数据 。 结 构 
sockaddr in 将 sockaddr 中 通用 的 端点 地 址 sa. data (14 字 节 长 ) 针对 TCP/IP 的 地 址 结构 做 了 细 化 ， 
分 为 Sbit 的 端口 地 址 sin. port 和 32bit 的 IP 地 址 。 在 Linux 系统 中 ， 结 构 in addr 的 定义 如 下 : 


struct in addr ( 
unsigned long s addr; /* IP address */ 
} 
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可 见 ， 结 构 in addr 仅 有 一 个 成 员 ， 表 示 一 个 32bit 的 数据 ， 即 IP 地 址 。 对 于 通用 地 址 结构 9 
的 其 余 bit， 填 充 0。 

Socket 接口 中 的 很 多 函数 都 是 为 通用 的 网 络 地 址 结构 设计 的 。 例 如 ， 我 们 既 可 以 用 bind 函数 
将 一 个 socket 绑 定 到 一 个 TCP/PP 的 端口 上 , 也 可 以 用 bind 函数 将 一 个 socket 绑 定 到 一 个 UNIX fr 
名 管道 上 。 因 此 ， 像 bind、connect、recvfrom、sendto 等 函数 都 要 求 一 个 sockaddr 结构 作为 指名 地 
址 的 参数 。 这 时 ， 我 们 就 要 使 用 强制 类 型 转换 把 表示 IP 地 址 的 sockaddr in 结构 转换 为 sockaddr 
结构 进行 函数 调用 。 但 实际 上 ，sockaddr 和 sockaddr in 结构 表示 的 均 是 同一 地 址 。 它 们 在 内 存 中 
对 应 的 区 域 是 重合 的 。 

SockedAddr 类 的 功能 比较 单一 ， 成 员 变量 mAddress 就 是 SockedAddr 的 实例 所 表示 的 TCP/IP 
端口 地 址 〈 包 括 IP 地 址 和 TCP/UDP 端口 号 ) 。 类 声明 mAddress 为 iperf_sockaddr 类 型 的 变量 ， 
而 在 文件 /lib/headers.h 中 ， 有 : 








typedef sockaddr in iperf sockaddr 


因此 ，iperf sockaddr 实际 上 就 是 sockaddr in 类 型 的 变量 。SockedAddr 的 成 员 函 数 都 是 对 
mAddress 进行 读 取 或 修改 的 操作 。 比较 复杂 的 成 员 函 数 是 setHostname, 它 完 成 了 地 址 解析 的 过 程 ， 
源 代码 如 下 已 将 不 相关 部 分 删除 》: 


/* -< 


void SocketAddr::setHostname( const char* inHostname ) { 
assert( inHostname != NULL ); 


mISIPv6 = false; 
mAddress.sin family = AF INET; 
// first try just converting dotted decimal 
// on Windows gethostbyname doesn't understand dotted decimal 
int rc - inet pton( AF INET, inHostname, (unsigned 
char*)&(mAddress.sin addr) ); 
1f 0 re == 0} { 
struct hostent *hostP = gethostbyname( inHostname ); 
if ( hostP -- NULL ) ( 
/* this is the same as herror() but works on more systems */ 
const char* format; 
switch ( h errno ) ( 
case HOST NOT FOUND: 


format = "$s: Unknown host\n"; 
break; 
case NO ADDRESS: 
format = "$s: No address associated with nameWMn"; 
break; 


case NO RECOVERY: 
format = "$s: Unknown server errorMn"; 
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break; 

case TRY AGAIN: 
format = "$s: Host name lookup failure Wn"; 
break; 


default: 
format = "$s: Unknown resolver errorWn"; 
break; 
k 
fprintf ( stderr, format, inHostname ); 


16.10 Socket 类 





Socket 的 定义 和 实现 分 别 在 文件 Socket.hpp 和 Socket.cpp 中 。 它 的 主要 功能 是 封装 socket 文件 
描述 符 、 此 Socket 对 应 的 端口 号 以 及 socket 接口 中 的 listen, accept, connect 和 close 等 函数 ， 为 
用 户 提 供 了 一 个 简单 易 用 而 又 统一 的 接口 。 同 时 作为 其 他 派生 类 的 基 类 。 

Socket 类 的 定义 如 下 : 


* A parent class to hold socket information. Has wrappers around 
* the common listen, accept, connect, and close functions. 


#ifndef SOCKET H 
#define SOCKET H 


#include "headers.h" 
#include "SocketAddr.hpp" 


/* 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 */ 
class Socket ( 
public: 

// stores server port and TCP/UDP mode 

Socket( unsigned short inPort, bool inUDP - false ); 


// destructor 
virtual -Socket(); 


protected: 
// get local address 
SocketAddr getLocalAddress( void ); 


// get remote address 
SocketAddr getRemoteAddress( void ); 


// server bind and listen 
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void Listen( const char *inLocalhost = NULL, bool isIPv6 = false ); 


// server accept 
int Accept( void ); 


// client connect 
void Connect( const char *inHostname, const char *inLocalhost - NULL ); 


// close the socket 
void Close( void ); 


// to put setsockopt calls before the listen() and connect() calls 
virtual void SetSocketOptions( void ) ( 


) 


// join the multicast group 
void McastJoin( SocketAddr &inAddr ); 


// set the multicast ttl 
void McastSetTTL( int val, SocketAddr &inAddr ); 


int  mSock; // socket file descriptor (sockfd) 
unsigned short mPort; // port to listen to 
bool mUDP; // true for UDP, false for TCP 


// end class Socket 


#endif // SOCKET H 


Socket 类 主要 提供 了 4 个 函数 : Listen, Accept. Connect 和 Close. getLocalAddress 和 
GetRemoteAddress 的 作用 分 别 是 获得 Socket 本 端的 地 址 和 对 端的 地 址 ， 两 个 函数 均 返 回 一 个 
SocketA ddr 实例 。 SetSocketOptions 的 作用 是 设置 Socket 的 属性 , 它 是 一 个 虚 函 数 , 因此 不 同 Socket 
的 派生 类 在 实现 此 函数 时 会 执行 不 同 的 操作 。 下 面 重点 介绍 Socket 类 的 几 个 函数 的 实现 。 


16.10.1 Listen 函数 
该 函数 的 代码 如 下 : 


Setup a socket listening on a port. 


* For TCP, this calls bind() and listen(). 


四 e xo 


For UDP，this just calls bind(). 

If inLocalhost is not null, bind to that address rather than the 
wildcard server address, specifying what incoming interface to 
accept connections on. 


void Socket::Listen( const char *inLocalhost, bool isIPv6 ) ( 


int rc; 
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SocketAddr serverAddr( inLocalhost, mPort, isIPv6 ); 


// create an internet TCP socket 
int type = (mUDP ? SOCK DGRAM : SOCK STREAM); 
int domain = (serverAddr.isIPv6() ? 

#ifdef IPV6 


AF INET6 
#else 

AF INET 
#endif 

: AF_INET); 


mSock = socket ( domain, type, 0 ); 
FAIL errno( mSock == INVALID SOCKET, "socket" ); 


SetSocketOptions(); 


// reuse the address, so we can run if a former server was killed off 
int boolean - 1; 


Socklen t len - sizeof (boolean); 
// this (char*) cast is for old headers that don't use (void*) 
setsockopt( mSock, SOL SOCKET, SO REUSEADDR, (char*) &boolean, len ); 


// bind socket to server address 


rc = bind( mSock, serverAddr.get sockaddr(), 


serverAddr.get sizeof sockaddr()); 


FAIL errno( rc == SOCKET ERROR, "bind" ); 


// listen for connections (TCP only). 
// default backlog traditionally 5 
if ( ! MUDE Y ( 


) 


rc - listen( mSock, 5 ); 
FAIL errno( rc == SOCKET ERROR, "listen" ); 


) // end Listen 


首先 ， 


构造 一 个 包含 本 地 服务 器 地 址 结构 的 SocketAddr 实例 ，inLocalhost 是 本 地 IP 地 址 (点 


分 十 进 制 字符 串 或 URL， 后 者 在 创建 SocketAddr 实例 时 完成 地 址 解析 ) ，mPort 是 Socket 构造 函 
数 中 设置 的 端口 。 接 着 ,通过 socket 系统 调用 创建 一 个 socket。SetSocketOptions 方法 设置 此 socket 





的 属性 。 因 


为 SetSocketOptions 是 虚 函 数 ， 在 Socket 类 的 实现 中 是 一 个 空 函 数 ， 而 不 同 Socket 的 


派生 类 在 覆盖 〈overwrite ) 该 函数 时 执行 的 操作 是 不 同 的 ， 这 是 多 态 特 性 的 应 用 。 此 后 设置 socket 


的 可 重用 C 











XE SERE AS 


reuse) 属性 ， 使 服务 器 在 重启 后 可 以 重用 以 前 的 地 址 和 端口 。 此 时 该 socket 还 没有 绑 
络 端点 AP 地 址 、 端 口 对 ) 上 ，bind 系统 调用 完成 此 功能 。 最 后 ， 如 果 该 socket 用 于 


一 个 TCP 连接 ， 则 调用 listen 函数 ， 一 来 向 系统 说 明 可 以 接收 到 socket 绑 定 端口 上 的 连接 请 求 ， 


二 来 设 定 请 


Socket 


求 等 待 队列 的 长 度 为 5。 
的 Listen 方法 将 地 址 解析 (地 址 结构 生成 )、socket、bind 和 listen 等 系统 调用 组 合 为 
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一 个 函数 。 在 应 用 时 ， 调 用 一 个 Listen 方法 就 可 以 完成 Server 端 socket 初始 化 的 所 有 工作 。 


16.10.2 Accept 函数 





Accept 函数 是 Server 完成 socket 初始 化 ， 等 待 连接 请 求 时 调用 的 函数 。 其 代码 如 下 : 


A eeen 
* After Listen() has setup mSock, this will block 

* until a new connection arrives. Handles interupted accepts. 

* Returns the newly connected socket. 


int Socket::Accept( void ) { 
iperf sockaddr clientAddr; 
Socklen t addrLen; 
int connectedSock; 


while ( true ) ( 
// accept a connection 
addrLen = sizeof( clientAddr ); 
connectedSock - accept( mSock, (struct sockaddr*) &clientAddr, 


&addrLen ); 


// handle accept being interupted 
if ( connectedSock == INVALID SOCKET && errno == EINTR ) ( 
continue; 


) 


return connectedSock; 


) 


) // end Accept 


Accept 函数 为 Accept 系统 调用 增添 了 在 中 断后 自动 重启 的 功能 。Server 线程 在 执行 Accept ER 


数 后 被 阻塞 ， 直 到 有 请 求 到 达 ， 或 者 接收 到 某 个 信号 。 若 是 后 面 一 种 情况 ，Accept 会 返回 
INVALID SOCKET 并 置 errno 为 EINTR. Accept 方法 检查 这 种 情况 ， 并 重新 调用 Accept 函数 。 


16.10.3 Connect 函数 
Connect 函数 是 Client 端 调用 的 函数 ， 作 用 是 连接 指定 的 Server。 其 代码 如 下 : 


/% 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


* Setup a socket connected to a server. 
* If inLocalhost is not null, bind to that address, specifying 
* which outgoing interface to use. 


void Socket::Connect( const char *inHostname, const char *inLocalhost ) { 


int rei 
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SocketAddr serverAddr( inHostname, mPort ) 


assert( inHostname !- NULL ); 


// create an internet socket 
int type = (mUDP ? SOCK DGRAM : SOCK STREAM); 


int domain = (serverAddr.isIPv6() ? 
#ifdef IPV6 


AF INET6 
#else 

AF_INET 
#endif 

: AF INET); 


mSock = socket( domain, type, 0 ); 
FAIL errno( mSock -- INVALID SOCKET, "socket" ); 


SetSocketOptions(); 


if ( inLocalhost !- NULL ) ( 
SocketAddr localAddr( inLocalhost ); 
// bind socket to local address 
rc - bind( mSock, localAddr.get sockaddr(), 
localAddr.get sizeof sockaddr()); 
FAIL errno( rc == SOCKET ERROR, "bind" ); 
) 


// connect socket 

rc = connect( mSock, serverAddr.get sockaddr(), 
serverAddr.get sizeof sockaddr()); 

FAIL errno( rc == SOCKET ERROR, "connect" ); 


) // end Connect 


首先 构造 一 个 SocketAddr 实例 保存 Server 端的 地 址 CIP 地 址 、 端 口 对 ) ， 同 时 按 需 完成 地 址 
解析 。socket 系统 调用 生成 socket 接口 。 虚 函数 SetSocketOptions 利用 多 态 特性 使 不 同 的 派生 类 按 
需要 设置 socket 属性 。 如 果 传 入 的 inLocalhost 参数 不 是 空 指针 ， 说 明 调 用 者 希望 指定 某 个 本 地 接 
口 作为 连接 的 本 地 端点 ， 此 时 通过 bind 系统 调用 把 该 socket 绑 定 到 这 个 接口 对 应 的 人 地 址 上 。 最 
后 调用 Connect 函数 完成 与 远 端 Server 的 连接 。 

这 里 要 强调 一 个 问题 ,TCP 和 UDP 在 调用 Connect 函数 时 的 操作 有 什么 不 同 ? 对 于 TCP 连接 ， 
调用 Connect 函数 会 发 起 建立 TCP 连接 的 三 次 握手 (3-way handshaking) 过 程 。 当 Connect 调用 返 
回 时 ， 此 过 程 已 经 完成 ， 连 接 已 经 建立 。 因 为 TCP 连接 使 用 字符 流 模型 ， 因 此 在 建立 好 的 连接 上 
交换 数据 时 ， 就 好 像 从 一 个 字符 流 中 读 取 ， 向 另 一 个 字符 流 中 写 入 一 样 。 

而 UDP 是 无 连接 的 协议 ， 使 用 数据 报 而 不 是 连接 的 模型 ， 因 此 调用 Connect 函数 并 不 发 起 连 
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接 的 过 程 ， 也 没有 任何 数据 向 Server 发 送 ， 而 只 是 通知 操作 系统 ， 发 往 该 地 址 和 端口 的 数据 报 都 
送 到 这 个 Socket 连接 上 来 ， 也 就 是 说 ， 把 这 个 地 址 、 端 口 对 和 该 Socket 关联 起 来 。UDP 在 IP 协 
议 的 基础 上 提供 了 多 路 访问 Cmultiplex ) 的 服务 , UDP 的 Connect 系统 调用 对 这 种 多 路 提供 了 Socket 
接口 与 对 端 地 址 间 的 对 应 关系 。 在 UDP 连接 中 , Connect 提供 的 这 种 功能 是 很 有 用 的 。 例 如, Server 
可 以 在 接收 到 一 个 Client 的 数据 报 后 ， 分 配 一 个 线程 执行 Connect 函数 与 该 Client 绑 定 ， 处 理 与 该 
Client 的 后 继 交 互 , 其 他 的 线程 继续 在 原来 的 UDP 端口 上 监听 新 的 请 求 。 因 为 在 Client 端 和 Server 
端 都 执行 了 Connect 函数 ， 所 以 一 个 Server 与 多 个 Client 间 的 连接 不 会 发 生 混乱 。 在 iPerf 对 UDP 
的 处 理 中 ， 就 使 用 了 这 种 技巧 。 


第 17 章 版 本 控制 和 SVN 工 具 


中 大 型 软件 项 目 往往 是 多 人 一 起 开发 的 ， 并 且 会 把 整个 软件 系统 划分 为 多 个 模块 ， 每 个 团队 
成 员 负 责 一 个 或 几 个 模块 , 并 且 自 己 的 模块 开发 完毕 后 , 需要 发 布 出 来 , 供 开发 其 他 模块 的 人 使 用 ， 
而 供 别人 使 用 的 模块 往往 是 一 个 比较 稳定 和 较 新 的 版 本 ， 每 次 这 个 模块 的 功能 更 新 和 Bug 修复 后 
都 需要 更 新 其 版 本 。 像 这 种 多 个 人 共同 开发 一 个 项 目 , 并 且 需 要 共享 资源 (代码 模块 ) 的 开发 方式 ， 
通常 需要 一 个 版 本 控制 系统 对 每 个 人 的 代码 进行 版 本 管理 。 常 见 的 版 本 控制 软件 有 SourceSafe (VC 
自 带 的 ) 、CVS( 并 发 版 本 系统 ) 和 SVN (Subversion 的 简称 ， 它 是 一 个 开放 源 代 码 的 版 本 控制 系 
统 ) o SourceSafe 现在 很 少 用 了 。 当 前 用 得 较 多 的 是 SVN 和 CVS， 相 对 而 言 ，SVN 比 CVS 速度 
快 , 但 代价 是 需要 更 多 服务 器 存储 空间 ， 因 为 SVN 完全 备份 所 有 的 工作 文件 。 下 面 我 们 以 SVN 为 
例 进行 介绍 。 


17.1 SVN 简介 


17.1.1. 什么 是 SVN 


SVN 是 一 个 开放 源 代码 、 可 以 自由 传播 使 用 的 版 本 控制 系统 。 它 把 需要 保存 的 代码 或 数据 文 
件 放 在 一 个 服务 器 上 ,同时 能 记录 每 一 次 文件 和 目录 的 修改 。 以 后 用 户 可 以 把 数据 恢复 到 早期 版 本 ， 
或 者 检查 数据 修改 的 历史 。 用 户 可 以 远程 通过 网 络 访问 SVN 的 版 本 库 ， 使 得 不 同 地 方 的 开发 人 员 
可 以 共享 最 新 版 本 的 文件 。 

SVN 分 为 服务 器 端 程序 和 客户 端 程序 两 部 分 。 通 常 , 管理 员 需 要 在 一 个 服务 器 上 安装 SVN 的 
服务 器 程序 ， 然 后 为 每 个 项 目 建立 相应 的 仓库 (Repository， 也 称 代码 库 ， 存 放 代 码 的 地 方 》; 而 
开发 人 员 则 在 自己 的 计算 机 上 安装 SVN 的 客户 端 程序 , 然后 就 可 以 通过 一 个 网 络 地 址 来 访问 SVN 
服务 器 上 的 仓库 了 。 

当 我 们 用 SVN 进行 版 本 控制 时 ， 它 会 记录 你 对 代码 库 进行 的 每 一 次 修改 〈 包 括 添加 、 修 改 、 
删除 等 ) ， 每 一 次 对 代码 库 的 修改 都 会 产生 一 个 修订 版 本 号 〈Revision) ， 修 订 版 本 号 标记 了 某 个 
时 刻 代码 库 的 状态 ， 我 们 可 以 根据 修订 版 本 号 回溯 任意 时 刻 的 代码 库 ， 就 像 VMware Workstation 
的 快照 功能 一 样 ， 修 订 版 本 号 也 类 似 某 个 时 刻 的 代码 库 的 快照 。 而 且 , 每 修改 一 次 代码 库 , 修订 版 
本 号 都 会 增加 1。 
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17.1.2 ”使 用 SVN 的 好 处 

在 开发 团队 中 ， 开 发 人 员 在 编写 代码 的 过 程 中 ， 每 个 人 都 会 生成 很 多 不 同 的 代码 版 本 ， 为 了 
有 效 统一 管理 这 些 代码 , 并 进行 共享 , 就 需要 一 个 版 本 控制 软件 来 进行 管理 , 比如 SVN T SVN, 
任何 有 相应 权限 的 人 在 需要 的 时 候 都 可 以 迅速 、 准 确 地 获取 相应 的 文件 版 本 。 并且 , 开发 人 员 一 旦 
想 恢复 到 以 前 某 个 版 本 上 ， 也 可 以 很 快 恢复 过 去 。 因 为 SVN 记录 了 每 一 次 的 修改 。 

我 们 写 一 个 项 目 ， 肯 定 会 有 要 修改 的 地 方 ， 当 已 经 修改 了 很 多 地 方 的 时 候 ， 一 旦 发 现 改 错 了 ， 
再 想 一 个 一 个 改 回 去 ， 可 能 会 不 记得 哪里 改动 过 了 ， 此 时 如 果 有 了 SVN 来 管理 ， 就 可 以 很 容易 地 
恢复 到 改动 之 前 的 某 个 版 本 。 


17.1.3 ”使 用 SVN 的 基本 流程 


当 服务 器 端 SVN 程序 配置 完毕 后 ， 开 发 人 员 就 可 以 使 用 SVN 客户 端 软件 进行 代码 管理 。 基 
本 使 用 流程 如 下 : 


(1) 开发 人 员 在 开始 一 天 的 工作 前 ， 先 从 SVN 服务 器 上 下 载 开 发 团队 的 最 新 源 代码 。 

(2) 在 自己 负责 的 模块 中 开始 代码 编辑 工作 。 每 隔 一 段 时 间 (比如 1 或 2 小时) 向 SVN 服 
务 器 提交 一 次 代码 ， 这 样 有 一 个 好 处 ， 尤 其 在 测试 某 段 代码 功 能 的 时 候 ， 如 果 觉 得 走 不 通 ， 可 以 恢 
复 到 前 一 两 个 小 时 的 代码 ， 然 后 重新 使 用 其 他 的 方法 来 实现 功能 。 

G) 到 了 快 下 班 的 时 候 ， 把 自己 的 代码 提交 到 SVN 服务 器 上 ， 一 天 工作 完成 。 


17.2 SVN 服务 器 的 安装 和 配置 


前 面 提 到 ，SVN 分 为 服务 器 端 软 件 和 客户 端 软 件 。 服 务 器 端的 软件 常见 的 有 两 种 : 一 种 是 
Subversion， 如 果 想 用 Web 方式 访问 SVN 服务 器 ， 还 需要 安装 和 配置 Apache (一 个 HTTP 服务 器 
软件 ) 。 而 且 如 果 安 装 在 Windows 上 ， 为 了 让 它 随 系统 自 启 ， 还 需要 将 Subversion 设置 为 服务 程 
序 〈service) ， 非 常 麻烦 。 另 一 种 是 VisualSVN Server， 它 集成 了 Subversion 和 Apache， 并 且 安 装 
的 时 候 VisualSVN Server 已 经 把 自己 设置 为 Windows 服务 ， 这 样 随 着 系统 启动 而 自 启 ， 且 对 于 
Apache 服务 器 的 配置 也 提供 了 图 形 界面 ， 只 需 指定 认证 方式 、 访 问 端口 等 ， 而 且 用 户 权限 的 管理 
也 是 通过 图 形 界 面 来 配置 的 ， 大 大 简化 了 用 户 的 操作 ，VisualSVN Server 不 愧 是 Visual 软件 。 但 要 
注意 的 是 ，VisualSVN Server 虽然 是 免费 的 ， 但 其 对 应 的 客户 端 软 件 VisualSVN 是 收费 的 。 


17.2.1 VisualSVN 服务 器 的 安装 和 配置 


VisualSVN Server 通常 安装 在 服务 器 的 操作 系统 下 ， 作 为 实验 ， 我 们 在 VMware Workstation 
下 安装 64 位 的 Windows Server 2012， 然 后 把 VisualSVN Server 安装 在 Windows Server 2012 中 。 

VisualSVN Server 的 下 载 地 址 为 : https://www.visualsvn.com/downloads/ < 

VisualSVN Server 分 为 32 位 的 版 本 和 64 位 的 版 本 。 

值得 注意 的 是 ，VisualSVN Server 2.7 以 上 版 本 是 不 支持 Windows Server 2003 的 ， 至 少 需要 
Windows Server 2008 或 Vista 等 操作 系统 。 
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我 们 选择 下 载 64 位 的 VisualSVN Server， 当 前 最 新 的 版 本 号 是 3.5.3。 文 件 不 大 ， 很 快 就 可 以 
下 载 完 成 ， 接 着 双击 安装 文件 ， 出 现 安装 向 导 界 面 ， 如 图 17-1 所 示 。 


大 VsualsvN Server 353 Setu DET 


Welcome to the VisualSVN Server 3.5.3 
Setup Wizard 


The Setup Wizard wil install VisualSVN Server 3.5.3 on your. 
computer. Click Next to continue or Cancel to exit the Setup 
Wizard. 


This product indudes the following components: 


Apache HTTP Server 2.2.31 
Apache Subversion 1.9.4 


e 
VISUALSVNSERVER 

















图 17-1 


在 图 17-1 中 可 以 看 到 这 个 产品 包括 Apache HTTP Server fil Apache Subversion, 其 实 Subversion 
才 是 真正 的 SVN 服务 器 软件 ，Apache HTTP Server 只 是 提供 Web 服务 。 
在 后 面 的 向 导 步 又 中 ， 会 提示 选择 “标准 版 本 ”还 是 “企业 版 本 ”， 如 图 17-2 所 示 。 
[jg VisualSVN Server 35.3 Setup. po iem) 


VisualSVN Server Editions 
Please select which edition of VisualSVN Server you'd Ike to install. 





There are two editions of VisualSVN Server available and depending on your needs you 
can choose which one suits you best. 

Standard Edition. 

A fully functional server that is great for individuals and small groups. Truly 

free of charge and permitted for commercial use. 


The best option for SMB and enterprises. Provides additional features such as 
Active Directory Single Sign-On and Remote Server Administration. 


图 17-2 


一 般 选 择 标准 版 本 就 够 用 了 ， 企 业 版 是 要 收费 的 ， 单 击 Standard Edition 按钮 ， 然 后 出 现 如 图 
17-3 所 示 的 对 话 框 。 
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Server port: [e z] F Use secure connection (https://) 





ee | 
图 17-3 


其 中 ，Location 是 VisualS VN 服务 器 程序 的 安装 位 置 , 如 果 要 修改 默认 位 置 , 可 以 单 击 该 行 末 
尾 的 “Browse.…. ”按钮 ;Repositories 的 中 文 翻译 是 仓库 ， 这 里 就 是 放置 客户 端 上 传 来 的 代码 的 位 
置 ， 这 个 仓库 是 存放 代码 的 仓库 ， 可 以 称 为 代码 库 ， 如 果 要 修改 这 个 路 径 ， 同 样 可 以 单 击 该 行 末尾 
HI“ Browse... ”按钮 ; Server Port 用 于 配置 Subversion 的 Web 服务 器 Apache 的 服务 端口 (VisualSVN 
通过 Web 服务 器 Apache 来 配置 Subversion) ， 要 注意 的 是 ，443 是 HTTPS 的 默认 端口 ， 如 果 
VisualSVN Server 所 在 的 主机 还 要 进行 HTTPS 的 Web 开发 ， 那 么 这 里 最 好 不 要 使 用 443 端口 ， 否 
则 进行 HTTPS Web 开发 还 要 指定 其 他 端口 , 不 然 会 产生 冲突 。 如 果 需 要 安全 连接 (使 用 HTTPS)， 
可 以 勾 选 Use secure connection (https://) 复 选 框 。 这 里 我 们 都 保持 默认 设置 。 接 着 单 击 Next 按钮 ， 
出 现下 一 个 向 导 界 面 , 再 单 击 Install 按钮 , 开始 正式 安装 。 稍 等 片刻 ,安装 完成 。VisualSVN Server 
安装 完毕 后 ， 可 以 在 “开始 ”一 “应 用 ”中 运行 VisualSVN Server Manager， 如 图 17-4 所 示 。 


RAD mea) BEM HAH 








A Faledto check for sofware updates: connection error. (D600C0005) 








Entrlogongi enabled 
nor logging isena 
Aerate legong is aeania 日 志 信 息 


Operational Iogan is disabled 

















图 17-4 


下 面 新 建 一 个 代码 库 ， 对 左 侧 栏 中 的 Repositories 右 击 ， 然 后 在 快捷 菜单 中 选择 Create New 
Repository， 如 图 17-5 所 示 。 
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Create New Repository... 
Import Existing Repository... 
Browse 
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出 现 选择 代码 库 类 型 的 对 话 框 , 默认 选项 是 创建 一 个 基于 FSFS 文件 系统 的 规则 代码 库 ， 这 里 
保持 默认 即 可 ， 如 图 17-6 所 示 。 

单 击 “ 下 一 步 ” 按 钮 ,将 出 现 要 求 输入 代码 库 名 称 的 对 话 框 ,我 们 输入 代码 库 的 名 称 为 myrepos， 
代码 库 的 名 称 通常 可 以 是 一 个 软件 项 目的 名 称 ， 如 图 17-7 所 示 。 


Repository Type Repository Name 
Choose the new repository type. Specify the name for the new repository. 








Select the preferred repository type. Repository Nare: 


© Reglar FSFS repository pra 
Create a regular Subversion repository based on the standard FSFS data store. 















































图 17-6 图 17-7 


然后 一 直 单 击 “ 下 一 步 ” 按 钮 ， 最 后 出 现 创建 成 功 的 对 话 框 ， 如 图 17-8 所 示 。 


Created Successfully 
Please review the created repository details. 





Repository Type: FSFS 
Repository Name: myrepos 
Repository URL: https: //WIN-AFUIOAPP 24M fe /mireoos 


Configured repository permissions: 
je 
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单 击 Finish 按钮 ， 关 闭 对 话 框 。 此 时 代码 库 是 空 的 ， 因 为 还 没有 用 户 为 其 迁 入 源 代 码 。 下 面 
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为 代码 库 创建 用 户 。 在 主 界面 的 左 侧 栏 的 User 上 右 击 ， 在 快捷 菜单 中 选择 Create User， 如 图 17-9 
所 示 。 

接着 出 现 创 建新 用 户 对 话 框 ， 在 对 话 框 中 输入 用 户 名 和 密码 〈 用 户 名 和 密码 都 是 区 分 大 小 写 
的 ) ， 如 图 17-10 所 示 。 





Tom 






























































rs : eeeeee 
查看 MV) » @ User name and password are case sensitive. 
剧 新 
导出 列表 (D-… [ «X 
帮助 (H) 

图 17-9 图 17-10 


这 里 输入 用 户 名 为 Tom， 密 码 为 123456， 然 后 单 击 OK 按钮 ， 就 可 以 创建 一 个 用 户 Tom， 再 
用 同样 的 方法 创建 coderl. coder2. testerl. tester2 和 leader1， 他 们 分 别 是 两 个 程序 员 、 两 个 测试 
人 员 和 一 个 项 目 经 理 。 然 后 可 以 对 他 们 进行 分 组 ,把 两 个 程序 员 分 在 一 个 组 里 ， 把 两 个 测试 人 员 分 
在 一 个 组 里 ， 项 目 经 理 不 分 组 。 对 左 侧 栏 的 Groups 右 击 ， 在 快捷 菜单 中 选择 “Create Group..." X 
新 建 分 组 ， 在 新 建 分 组 对 话 框 中 输入 组 名 为 “开发 组 ”， 并 单 击 “Add…” 按 钮 把 coderl 和 coder2 
作为 开发 组 的 成 员 ， 如 图 17-11 所 示 。 

用 同样 的 方法 ， 再 新 建 一 个 测试 组 ， 把 testerl 和 tester2 作为 其 成 员 。 

接 下 来 ， 我 们 要 把 这 些 用 户 添 加 到 刚才 创建 的 项 目 里 。 对 刚刚 创建 的 代码 库 myrepos 右 击 ， 
在 快捷 菜单 中 选择 “Properties...”， 如 图 17-12 所 示 。 





Copy URL to Clipboard 
Browse 















































图 17-11 图 17-12 


然后 出 现 属性 对 话 框 , 在 Security 页 中 可 以 添加 不 同 的 用 户 , 并 且 可 以 让 不 同 的 用 户 具 有 不 同 
的 权限 ， 首 先 把 Everyone 删除 ， 如 图 17-13 所 示 。 
在 属性 对 话 框 中 单 击 “Add…” 按 钮 ， 然 后 在 弹出 的 对 话 框 中 选择 开发 组 ， 如 图 17-14 所 示 。 
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图 17-13 图 17-14 


然后 单 击 OK 按钮 ， 开 发 组 和 leaderl 就 添加 进来 了 ， 并 且 他 们 都 具有 读 写 权限 ， 如 图 17-15 
所 示 。 

下 面 再 为 测试 组 添加 权限 ， 因 为 测试 人 员 不 需要 修改 代码 ， 所 以 他 们 只 需要 只 读 权限 即 可 。 
我 们 把 Tom 作为 外 来 实习 生 , 暂时 不 能 读 写 代码 , 因此 给 他 的 权限 为 No Access; 如 图 17-16 所 示 。 



















































































Inherit from parent. 
O No Access 


O Read Only 



























































图 17-15 图 17-16 


现在 服务 端的 配置 基本 完成 了 。 下 面 可 以 进行 SVN 客户 端的 配置 。 


17.222 SVN 客户 端 在 Windows 上 的 使 用 


SVN 客户 端 分 两 种 ， 一 种 是 在 Windows 上 使 用 ， 用 于 对 Windows 下 的 开发 工具 (如 VC) 开 
发 的 项 目 进 行 版 本 管理 ， 另 一 种 是 在 Linux 上 使 用 ， 用 于 对 Linux. 下 的 项 目 进行 管理 。 这 里 先 对 
Windows 下 的 SVN 客户 端 进行 介绍 。 

VisualSVN 官方 的 客户 端 是 要 收费 的 。 因 此 我 们 使 用 免费 的 Windows 下 的 SVN 客户 端 软件 
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TortoiseSVN， 这 个 软件 可 以 从 官网 Chttpsz//tortoisesvn.net/) 下 载 。 但 要 注意 从 1.9 版 本 开始 ， 对 操 
作 系 统 的 要 求 就 是 Vista 或 以 上 版 本 了 ， 因 此 如 果 要 在 XP 下 使 用 ， 可 以 使 用 1.9 以 下 的 版 本 。 这 
里 使 用 的 是 1.8 版 本 ， 如 果 官网 上 没有 ， 可 以 去 网 上 搜索 。 


1. 安装 TortoiseSVN 
我 们 把 TortoiseSVN 下 载 到 与 安装 VisualSVN 服务 器 不 同 的 计算 机 上 ， 这 个 计算 机 通常 用 于 
开发 人 员 进行 项 目 开发 , 这 个 计算 机 上 需要 进行 版 本 管理 的 项 目 源 代码 可 以 通过 TortoiseSVN 客户 


端 软件 和 VisualSVN 服务 器 软件 进行 通信 ， 从 而 实现 对 项 目 源 代码 的 版 本 管理 。 双 击 TortoiseSVN 
安装 包 ， 出 现 如 图 17-17 所 示 的 对 话 框 。 


(S TortoiseSVN 1.8.11 26392 (32 bit) Setup xj 





Welcome to the TortoiseSVN 
1.8.11.26392 (32 bit) Setup 
Wizard 


The Setup Wizard wil install TortoiseSVN 1.8,11,26392 (32 
bit) on your computer. Click Next to continue or Cancel to, 
exi the Setup Wizard. 


z 
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图 17-17 


直接 单 击 Next 按钮 进行 安装 ， 如 果 在 安装 过 程 中 提示 “Please wait while the installer finishes 
determining your disk space requirements”， 可 以 先 退 出 安装 ， 然 后 停止 VisualSVN 服务 ( 单 击 “ 开 
始 ” 一 “运行 ”， 输 入 Services.msc， 找 到 VisualSVN 服务 ， 然 后 右 击 ， 选 择 “ 停 止 ”来 停 掉 该 服 
务 ) ， 接 着 重新 安装 TortoiseSVN， 就 能 安装 成 功 了 。 安 装 完成 的 对 话 框 如 图 17-18 所 示 。 


SVE 1.8.11.26392 (32 bit) Setup xi 





Completing the TortoiseSVN 
1.8.11.26392 (32 bit) Setup 
Wizard 

Click the Finish button to exit the Setup Wizard. 


I? Show Changelog 


Thanks for using TortoiseSVN. You can show your 
appreciation and support future development by 


TortoiseSVN 








图 17-18 


TortoiseSVN 安装 完毕 后 ， 就 可 以 把 想 要 进行 版 本 管理 的 项 目 导入 SVN 代码 库 中 了 。 通 常 使 
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用 TortoiseSVN 前 ， 要 确保 客户 端 计算 机 和 装 有 SVN 服务 器 的 计算 机 能 相互 ping 通 ， 和 否则 在 使 用 
过 程 中 可 能 会 出 现 无 法 连接 到 服务 器 的 提示 。 

2. ping 通 客户 端 和 服务 端 

我 们 在 VMware 虚拟 机 软件 中 新 建 一 个 Windows Server 2012 系统 ， 首 先 设置 VMware 的 网 络 
适配器 为 “ 仅 主 机 模式 ”《〈 仅 主机 模式 用 的 虚拟 网 卡通 常 是 VMnetl1) ， 如 图 17-19 所 示 。 

此 时 真实 的 机 子 和 虚拟 机 子 都 通过 虚拟 网 卡 VMnetl 来 网 络 通信 ， 但 如 果 要 相互 ping 通 ， 还 
需要 关闭 各 自 的 Windows 防火 墙 。 我 们 的 客户 端 计算 机 是 Windows Server 2003 系统 ， 关 闭 防火 墙 
就 不 介绍 了 , 下面 介绍 服务 端 计算 机 Windows Server 2012 系统 防火 墙 的 关闭 , Windows Server 2012 
系统 的 防火 墙 设置 在 “控制 面板 一 系统 和 安全 一 Windows 防火 墙 ” 中 ， 左 边 有 一 个 “启用 或 关闭 
Windows 防火 墙 ”， 单 击 它 ， 出 现 如 图 17-20 所 示 的 界面 。 


自 定义 各 类 网 络 的 设置 
你 可 以 修改 使 用 的 每 御 半 弄 的 网 络 的 防火 志 设 年 . 
专用 网 阁 讼 轩 
Q OBR wnd 
Tut 


9 © 关闭 Windows BORRES) 
公用 网 阁 设置 
[/] O 局 用 Windows Boc 
BIER AGER , 旬 


9 (& 关闭 Windows 防火 增 [ 不 推荐 ) 























图 17-19 图 17-20 


全 部 选中 “关闭 Windows 防火 墙 ” 后 ， 点 击 “ 确 定 ” 按 钮 。 现 在 真实 机 和 虚拟 机 应 该 能 相互 
ping 通 了 ， 如 果 还 不 能 ping 通 ， 则 要 查看 一 下 IP 是 否 在 同一 个 子 网 。 

3. 获取 代码 库 的 URL 

SVN 客户 端 软件 TortoiseSVN 要 访问 某 个 代码 库 ， 必 须 先 获得 该 代码 库 的 URL， 它 相当 于 这 
个 代码 库 的 网 络 地 址 。 这 个 URL 可 以 从 VisualSVN Server 上 获得 ,方法 是 打开 VisualSVN Server 
Manager, 然后 在 左 侧 展 开 VisualSVN Server 一 Repositories, 右 击 myrepos, 在 快捷 菜单 中 选择 Copy 
URL to Clipboard， 即 复制 URL 到 粘贴 板 ， 这 个 URL 也 可 以 在 右 侧 上 方 看 到 ， 如 图 17-21 所 示 。 





myrepos  (https://WIN-NFUIOAPP24M/svn/myrepos/) 


图 1721 


4. 导入 项 目 


作为 测试 ， 我 们 用 VC2005 建立 一 个 简单 的 控制 台 工 程 HelloWorld， 然 后 把 这 个 工程 导入 
myrepos 代码 库 中 。 在 路 径 D:\ex 下 新 建 一 个 控制 台 工程 HelloWorld， 然 后 编译 运行 ，VC 会 在 解 
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决 方案 文件 夹 和 工程 目录 文件 夹 下 分 别 生成 Debug 目录 ， 这 些 目录 存放 的 都 是 生成 的 可 执行 文件 
和 中 间 文 件 ， 这 些 文件 我 们 不 需要 导入 代码 库 中 , 所 以 在 导入 之 前 ， 要 对 导入 的 文件 进行 一 个 过 滤 
设置 ， 哪 些 文件 或 文件 夹 不 需要 导入 ， 要 告诉 TortoiseSVN。 比 如 ， 我 们 不 想 让 Debug 文件 、.ncb 
文件 和 .suo 文件 导入 代码 库 中 ， 首 先 打开 “我 的 电脑 “， 进 入 Dex， 然 后 对 HelloWorld 右 击 ， 在 
快捷 菜单 中 会 发 现 有 一 个 菜单 项 TortoiseSVN， 进 入 其 子 菜单 ， 选 择 Settings， 打 开设 置 对 话 框 ， 
然后 在 右 侧 的 Global ignore pattern 后 输入 “*debug*Debug *.ncb *.suo”， 如 图 17-22 所 示 。 


iseSYN 





图 17-22 


其 中 ，*debug 表示 名 字 为 debug 的 文件 夹 都 不 要 导入 代码 库 中 ，*Debug 表示 名 字 为 Debug 的 
文件 夹 都 不 要 导入 代码 库 中 ，*.ncb 和 *.suo 表示 后 缀 名 为 ncb 和 suo 的 文件 都 不 要 导入 代码 库 中 ， 
注意 名 称 都 是 区 分 大 小 写 的。 解决 方案 文件 夹 下 的 debug. 目录 是 小 写 的 ， 而 工程 目录 下 的 Debug 
目录 的 第 一 个 字母 是 大 写 的 ， 所 以 要 分 别 输入 *debug 和 *Debug。 如 果 要 过 滤 其 他 文件 夹 或 文件 ， 
设置 方法 类 似 。 输 入 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 关 闭 设 置 对 话 框 。 

下 面 我 们 准备 导入 项 目 。 打 开 “ 我 的 电脑 ”， 进 入 Dex， 然 后 对 HelloWorld 右 击 ， 此 时 在 快 
捷 菜 单 中 会 发 现 有 一 个 菜单 项 TortoiseSVN， 进 入 其 子 菜单 ， 选 择 “Import...”， 出 现 如 图 17-23 
所 示 的 对 话 框 。 
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我 们 把 代码 库 myrepos 的 URL 粘贴 到 对 话 框 的 URL of repository 下 面 ， 然 后 单 击 OK 按钮 ， 
此 时 会 出 现 输入 用 户 名 和 密码 的 对 话 框 ， 如 图 17-24 所 示 。 





er D: \ex\HelloForld - Import — TortoiseS¥N 











17-23 图 17-24 


这 个 用 户 名 就 是 访问 代码 库 myrepos 的 账号 ， 也 就 是 我 们 在 前 面 建立 的 具有 不 同 权限 的 访问 
账号 ， 比 如 开发 组 、 测 试 组 或 经 理 等 。 在 这 里 输入 用 户 名 coderl 及 其 密码 ，coderl 属于 开发 组 ， 
具有 读 写 权 限 。 

输入 完毕 后 ， 单 击 OK 按钮 ， 然 后 导入 过 程 开 始 ， 如 图 17-25 所 示 。 











图 17-25 


导入 完毕 后 ， 我 们 再 到 VisualSVN Server Manager 中 可 以 看 到 HelloWorld 全 部 代码 已 经 在 
myrepos 中 了 ， 如 图 17-26 所 示 。 
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$8188 C++ 跨 平台 开发 


随 着 C++ 语 言 在 现代 软件 工程 方面 的 广泛 应 用 ,对 其 多 元 化 软件 系统 开发 的 需求 也 日 益 增加 ， 
本 章 将 结合 C++ 语言 自身 的 特性 ， 论 述 一 线 实践 开发 中 C++ 的 可 移植 性 以 及 跨 平台 软件 的 设计 方 
法 。 


18.1 什么 是 跨 平台 


跨 平台 是 软件 开发 中 一 个 重要 的 概念 ， 即 不 依赖 于 操作 系统 ， 也 不 依赖 硬件 环境 。 一 个 操作 
系统 下 开发 的 应 用 程序 放 到 另 一 个 操作 系统 下 依然 可 以 运行 .而 跨 平 台 开发 的 需求 源 于 现代 软件 工 
程 的 发 展 , 使 所 开发 的 应 用 程序 能 够 支持 各 种 不 同 的 平台 ,可 以 为 应 用 程序 本 身 带 来 巨大 的 市 场 潜 
力 ， 同 时 ， 这 也 会 给 应 用 程序 的 开发 增加 更 大 的 工作 量 。 如 果 应 用 程序 针对 每 种 操作 系统 、CPU 
提供 并 测试 各 自 的 编译 版 本 , 再 发 布 到 各 自 平台 上 而 产生 不 同 的 软件 版 本 , 这 种 做 法 将 会 以 巨大 的 
软件 开发 和 版 本 控制 的 成 本 为 代价 。 因 此 , 跨 平 台 的 开发 致力 于 使 应 用 程序 可 以 几乎 不 做 任何 修改 
就 能 运行 在 不 同 的 平台 上 。 而 目前 流行 的 操作 平台 之 间 的 差异 使 跨 平 台 开发 面临 着 诸多 问题 。 总 的 
来 说 ， 跨 平台 开发 的 思想 涉及 软件 的 整个 开发 周期 ， 从 架构 、 设 计 、 编 码 、 测 试 到 发 布 。 编 程 语言 
并 不 能 够 直接 操作 计算 机 硬件 设备 ， 它 们 需要 通过 调用 系统 提供 的 API (应 用 程序 接口 ) 来 实现 对 
计算 机 的 操作 ， 而 目前 市 面 上 流行 的 主流 平台 ,例如 Windows. UNIX 系列 的 系统 之 间 ， 这 种 应 用 
程序 接口 的 实现 方式 差异 很 大 , 而 且 实现 的 原理 也 不 尽 相同 ， 甚至 同样 是 开源 的 Linux 之 间 也 会 有 
着 细节 上 的 差别 ， 这 些 对 操作 系统 的 依赖 会 给 跨 平 台 下 的 软件 开发 带 来 潜在 的 问题 。 


18.2 ”C++ 的 可 移植 性 


在 跨 平台 软件 项 目的 开发 过 程 中 ， 自 然 会 涉及 软件 项 目 可 移植 性 的 概念 。 本 身 来 讲 ， 跨 平台 
开发 和 可 移植 性 代码 所 阐述 的 核心 是 一 致 的 。 为 了 使 软件 产品 可 以 在 多 种 平台 下 执行 发 布 , 在 开发 
的 过 程 中 , 或 者 说 在 整个 开发 周期 中 ,产品 的 设计 都 需要 根据 不 同 平台 下 的 差异 来 进行 ， 从 而 使 产 
品 的 源 代码 具备 可 移植 性 。 因此，C++ 语 言 跨 平台 软件 开发 的 设计 也 会 以 设计 可 移植 性 的 代码 和 编 
译 环境 为 核心 。 


18.2.41. 可 移植 性 的 概念 
在 实际 开发 过 程 中 ，C++ 语 言 所 开发 的 项 目 或 产品 需要 在 不 同 的 平台 上 进行 编译 ， 从 而 实现 在 
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多 平台 上 的 可 执行 性 ， 简 单 地 归纳 ，C++ 语 言 在 跨 平台 下 的 项 目 开 发 需要 一 次 编写 ， 多 次 编译 。 这 
种 特性 就 引发 了 C++ 语言 的 可 移植 性 问题 。 可 移植 性 本 身 是 一 种 考虑 问题 的 方式 ， 而 不 是 一 种 状 
态 。 例 如 ， 将 Linux 下 的 应 用 程序 移植 成 能 在 Windows 系统 上 运行 的 程序 ， 这 就 是 可 移植 性 问题 
的 具体 实现 方式 , 但 这 并 不 是 可 移植 性 的 概念 。 可 移植 性 对 代码 、 不 同 平台 下 的 环境 部 署 有 着 很 高 
的 要 求 ， 而 解决 这 些 需 求 中 所 涉及 的 问题 就 是 可 移植 性 的 概念 。 

如 今 ， 许 多 语言 都 编译 成 一 种 通用 的 中 间 形 式 ， 例 如 Java 语言 ， 先 编译 成 字 节 码 ， 再 在 JVM 
中 运行 , 这 是 保持 可 移植 性 的 一 个 好 方法 , 不 过 , 这 是 以 显著 增加 代码 量 和 执行 时 间 为 代价 的 。 此 
外 ,这 样 的 通用 代码 必须 由 虚拟 机 或 运行 时 环境 来 执行 。 而 更 复杂 的 是 ， 虚 拟 机 或 运行 时 环境 每 一 
次 实现 都 有 可 能 出 现 难以 察觉 的 Bug 或 者 实现 差异 ， 由 此 得 到 的 可 移植 程序 仍然 对 平台 有 依赖 性 。 
在 适合 使 用 较 高 级 语言 的 领域 ， 使 用 它们 编写 可 移植 程序 要 比 使 用 C 或 者 C++ 语言 容易 得 多 ， 但 
是 ， 能 够 提供 硬件 访问 和 高 性 能 的 低级 语言 始终 都 有 用 武之 地 ， 而 且 这 些 仍然 需要 支持 可 移植 性 。 

理论 上 的 可 移植 性 与 实践 中 的 可 移植 性 之 间 存 在 着 巨大 的 差距 ， 尽 管 C/C++ 语言 本 身 的 核心 
是 可 移植 性 ， 因 为 能 够 几乎 被 所 有 的 平台 所 支持 , 但 是 它们 却 充 满 了 可 移植 性 的 问题 ,其 中 一 些 具 
体 的 原因 是 目前 并 没有 完全 严格 统一 的 标准 , 而 更 多 的 原因 则 在 于 C/C++ 语言 本 身 专注 于 编写 系统 
级 软件 的 高 级 语言 程序 , 这 也 是 为 什么 C/C++ 语言 可 以 在 众多 高 级 编程 语言 中 依旧 保留 着 自己 的 优 
势 领域 。 


18.22 ”影响 C++ 语言 可 移植 性 的 因素 


即使 她 开 各 个 平台 间 的 差异 性 , C++ 语言 在 跨 平 台 的 项 目 开 发 中 也 有 着 许多 因素 影响 其 可 移植 
性 。C++ 语 言 自身 的 特性 及 其 编译 环境 的 多 样 性 都 为 其 多 元 平台 的 开发 增加 了 一 定 的 复杂 性 。 具 体 
表现 如 下 。 


1. 编程 语言 本 身 

由 于 C++ 语言 与 C 语言 之 间 的 紧密 关系 ，C 语言 本 身 的 特性 对 于 C++ 语言 也 同样 有 效 。C 语 
言 从 诞生 开始 就 被 认为 是 可 移植 性 良好 的 语言 。C 语言 能 够 得 到 广泛 认可 的 一 个 主要 原因 是 UNIX 
系统 能 在 多 元 化 的 硬件 平台 上 运行 ， 而 UNIX 操作 系统 的 绝 大 多 部 分 是 用 C 语言 写成 的 ， 另 外 标 
准 化 的 努力 更 让 C 语言 成 为 一 个 可 移植 性 很 强 的 编程 语言 。 遵 循 ANSI 标准 , 避免 使 用 编译 器 开发 
商 的 语言 扩展 是 消除 C 可 移植 性 问题 的 重要 步骤 。 在 开发 的 过 程 中 ， 源 代码 应 当 尽量 避免 编译 器 
开发 商 提供 的 语言 扩展 而 接受 基于 标准 的 C/ C++ 代码 ， 从 而 提高 软件 产品 的 可 移植 性 。 

2. 编译 器 

作为 负责 将 源 代码 转变 成 可 执行 形式 的 编译 器 ， 自 然 与 C/C++ 语言 的 可 移植 性 紧密 相关 。 编 
译 器 可 用 于 控制 代码 遵循 标准 的 程度 ， 但 编译 器 的 作用 不 止 于 此 。 目 前 流行 的 众多 编译 器 中 ， 如 
Windows 平 台 上 的 微软 Visual Studio CH, 而 在 很 多 平台 上 都 有 的 GNU 的 GCC 则 支持 MAC OS X. 
Linux 和 通过 Cygwin 项 目 支持 Windows， 由 于 C/C++ 语言 的 定义 ， 许 多 语言 特性 的 实现 细节 都 留 
给 编译 器 开发 商 自行 处 理 ， 结 果 造 成 使 用 这 些 特性 会 引发 源 代码 的 不 可 移植 性 。 

根据 定义 ，C++ 内 建 类 型 的 长 度 与 编译 器 是 相关 的 。 举 例 来 说 ，C 标准 规定 short 类 型 必须 至 
DA 16 位 ; 而 int 类 型 必须 至 少 和 short 类 型 所 占 内 存 空 间 一 样 大 ，long 类 型 必须 至 少 和 int 类 型 
所 占 内 存 空 间 一 样 大 。 这样 一 来 ,同样 的 类 型 在 不 同 的 编译 器 、 不 同位 数 的 机 器 上 会 有 着 不 同 的 长 
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度 定义 。 在 实际 开发 过 程 中 ， 很 有 可 能 会 出 现 如 表 18-1 所 示 的 情况 。 
表 18-1 不 同位 数 的 机 器 上 会 有 着 不 同 的 长 度 定义 


而 这 些 定义 在 不 同 版 本 的 编译 器 中 可 能 还 会 有 所 区 别 ， 虽 然 一 般 int 变量 默认 为 一 个 原生 字 长 
(在 32 位 机 上 ，int 类 型 为 32 位， 而 在 64 位 机 上 则 为 64 位 ) ， 但 是 这 一 点 也 是 不 能 保证 的 ， 而 








长 度 不 同 将 会 引发 一 系列 的 潜在 异常 ， 如 位 操作 符 的 运算 、 文 件 存储 等 。 

C 和 C++ 都 不 指定 一 个 char 型 是 有 符号 的 还 是 无 符号 的 。 这 个 是 由 编译 器 的 开发 人 员 自行 决 
定 的 。 当 代码 里 的 char 类 型 和 int 类 型 混合 使 用 的 时 候 ， 就 有 可 能 产生 问题 ， 典 型 的 例子 是 使 用 
getchar( ) 函 数 从 标准 输入 〈stdin ) 读 入 一 串 字 符 到 一 个 无 符号 的 char 变量 里 。getchar 的 返回 值 是 
一 个 int 值 , 通常 -1 代表 读 到 了 文件 结尾 。 如 果 在 循环 中 比较 -1 和 一 个 无 符号 char 值 ， 这 样 无 论 如 
何 getchar( ) 是 不 会 遇 到 EOF 的 ， 这 个 循环 也 将 会 进入 死 循 环 的 状态 。 要 克服 这 类 移植 性 问题 ， 就 
要 遵循 一 定 的 移植 性 标准 : 一 律 使 用 C++ 风格 的 类 型 转换 ， 遵 循 函数 原型 ， 修 复 每 一 个 编译 器 产 
生 的 警告 。 

所 以 开发 C++ 语言 跨 平 台 项 目 需要 建立 可 移植 的 运行 库 ， 而 库 中 必 不 可 少 的 是 对 于 常用 内 建 
类 型 以 及 函数 原型 的 应 用 。 


3. 编译 系统 

编译 系统 可 以 简单 到 一 个 执行 编译 器 和 连接 器 的 命令 行 脚本 ， 也 可 以 复杂 到 一 套 处 理 跨 平台 
Makefile 生成 的 策略 。 集成 开发 系统 (Integrated Development Environment, IDE) ,如 微软 的 Visual 
Studio .NET， 或 者 是 Apple 的 Interface Builder 和 Project Builder 等 ， 则 直接 束缚 了 可 移植 编译 系 
统 的 开发 , 如 果 在 Windows 或 者 Mac OS X 上 使 用 集成 开发 系统 ,那么 Linux 系统 的 源 代码 移植 是 
完全 无 从 做 起 的 。 跨 平台 的 软件 开发 必须 要 使 用 一 个 标准 的 可 共享 的 编译 系统 ， 从 而 才能 使 源 代码 
在 不 同 的 机 器 之 间 轻 易 地 移植 编译 。 而 流行 于 开源 社区 的 Makefile 策略 正 是 解决 这 种 编译 系统 差 
异 的 很 好 的 选择 。UNIX 系统 (包括 Linux 系统 自身 ) 能 够 很 好 地 支持 这 种 编译 方式 ， 而 Windows 
自身 除了 有 支持 Makefile 策略 (nmake) 的 机 制 以 外 , 目前 还 有 很 多 的 第 三 方 库 支持 这 种 编译 策略 ， 
如 MiniGW、MKSToolkits 等 。 


4. 用 户 界面 

基本 上 , 每 个 操作 平台 都 有 它 自己 的 用 户 界面 工具 包 来 支持 图 形 界面 (GUI) 的 开发 , Windows 
平台 上 有 Win32、MFC 和 目前 广泛 流行 的 .Net API; 在 Mac OSX 上 有 基于 Object-C 的 Cocoa 框架 ; 
而 在 Linux 平台 上 的 选择 范围 非常 大 ， 从 Gtk+(GNOME)、Qt(KDE) 到 其 他 诸如 Xt/MotiKCDE) 等 ， 
都 是 基于 X -Windows 系统 的 。 

这 些 工具 包 的 源 代 码 互 不 兼容 ， 而 且 使 用 方法 及 图 形 界面 也 完全 不 同 。 虽 然 QtKDE) 可 以 对 
Windows 有 很 好 的 支持 ， 不 过 微软 提供 的 工具 绝对 地 统治 了 Windows 的 平台 。 然 而 ， 在 开发 跨 平 
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台 的 软件 项 目 中 ， 使 用 跨 平台 的 GUI 工具 包 却 依旧 是 开发 人 员 的 主要 选择 ， 因 为 如 果 单 独 开 发 一 
个 自己 的 图 形 界面 工具 包 ， 其 代价 不 亚 于 分 离 UI 代码 而 使 用 每 个 平台 下 原生 的 GUI 开发 工具 。 
wxWidgets 是 一 个 跨 平 台 的 开源 GUI 工具 包 ， 其 项 目的 开发 源 于 这 样 一 个 要 求 : 开发 的 应 用 程序 
既 能 运行 于 Windows， 也 能 运行 于 图 形 界 面 的 UNIX， 由 于 其 完全 的 开源 协议 和 自身 优秀 的 性 能 ， 
使 其 成 为 目前 多 元 化 软件 项 目 开 发 的 绝 佳 选择 。 同 时 ， 在 它 的 API 和 事件 系统 都 留 下 了 很 多 MFC 
的 痕迹 ， 这 也 是 它 能 够 得 到 广泛 使 用 的 重要 原因 。 

5. 不 同 平台 间 的 差异 

为 使 所 开发 的 软件 系统 支持 多 种 平台 ， 首 先 需 要 了 解 不 同 平台 下 语言 特性 的 差异 ， 从 设计 软 
件 开 始 就 把 这 些 因素 考虑 进去 ， 这 样 才能 最 低 限度 地 降低 C++ 语言 所 开发 的 项 目 在 移植 性 过 程 中 
的 复杂 程度 。Windows 和 UNIX 是 当前 两 大 主流 操作 系统 平台 ， 基 于 C/C++ 的 开发 人 员 经 常会 面 
临 这 两 个 平台 之 间 移植 的 问题 。UNIX 作为 一 个 开发 式 的 系统 ， 其 下 又 出 现 了 很 多 分 支 ， 包 括 Sun 
的 Solaris, IBM 的 AIX, HP UNIX, SCO UNIX, Free BSD、 苹 果 的 MACOS 以 及 开源 的 Linux 
等 。 对 于 这 些 UNIX 的 分 支 操作 系统 ， 其 实现 又 有 很 大 的 差别 , 因此 开发 人 员 又 要 针对 这 些 不 同 的 
系统 进行 移植 。 

这 种 平台 的 差异 则 表现 在 多 个 方面 ， 如 打开 文件 句柄 数 的 限制 、Socket 等 待 队列 的 限制 、 进 
程 和 线程 堆栈 大 小 的 限制 等 ， 因 此 在 开发 的 过 程 中 ， 必 须 考虑 这 些 限制 因素 对 程序 的 影响 。 当 然 ， 
有 些 限制 参数 可 以 适当 调整 ， 这 就 需要 在 发 布 程序 的 时 候 加 以 声明 。 举 例 来 说 ， 在 不 同 的 平台 下 ， 
字 节 的 存储 顺序 分 为 大 字 节 序 和 小 字 节 序 两 种 , 这 两 种 方式 中 每 一 段 字 节 的 存储 位 置 的 具体 差异 如 
表 18-2 所 示 。 





表 18-2 两 种 方式 中 每 一 段 字 节 的 存储 位 置 


十 六 进 制 表 示 Windows 内 存 表示 UNIX 内 存 表示 
0x00004E20 20 4E 00 00 00 00 4E 20 


此 外 , 一 般 的 操作 系统 对 每 个 进程 和 线程 可 以 使 用 的 资源 数 都 有 限制 ,比如 一 个 进程 可 以 创建 
的 线程 数 、 一 个 进程 可 以 打开 的 文件 描述 符 的 数量 、 进 程 和 线程 栈 大 小 的 限制 和 默认 值 等 。 针 对 这 
些 问 题 ， 首 先 要 分 析 和 考虑 所 开发 的 应 用 程序 的 规模 ， 会 不 会 受 这 些 限 制 的 影响 ,如 果 需 求 大 于 系 
统 的 限制 ， 可 以 通过 适当 地 调整 系统 参数 来 解决 ,如 果 还 不 能 解决 ， 就 得 考虑 采用 多 进程 的 方式 来 
解决 。 与 此 同时 ，Linux 的 线程 是 通过 进程 实现 的 ， 实 际 上 是 假 的 线程 。 如 果 程序 只 在 Linux 下 运 
行 ， 就 可 以 考虑 直接 使 用 多 进程 技术 来 代替 多 线程 ， 因 为 在 Linux 下 ， 多 线程 并 不 能 带 来 相对 于 多 
进程 的 优势 。 

在 实际 开发 过 程 中 ， 操 作 平 台 的 不 同 所 带 来 的 移植 性 问题 贯穿 始终 ， 从 最 初 的 设计 、 代 码 编 
写 到 最 终 的 测试 阶段 。 因 此 ， 开 发 跨 平 台 的 软件 项 目 一 定 要 从 需求 入 手 ， 分 析 其 中 所 涉及 的 问题 ， 
体现 在 软件 架构 的 设计 上 ， 这 样 才能 够 使 开发 高 效 、 高 质量 地 进行 下 去 。 


6. 硬件 平台 体系 结构 


跨 平台 开发 还 包含 一 个 概念 ， 就 是 跨 硬件 平台 的 开发 ， 然 而 虽然 硬件 平台 之 间 的 差异 很 大 ， 
但 是 一 般 的 应 用 程序 开发 很 难 直 接 接触 到 ， 而 且 操作 系统 提供 的 接口 函数 就 可 以 完成 这 部 分 问题 。 
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因此 ， 一 般 情 况 下 ， 如 果 应 用 程序 没有 用 到 汇编 语言 ， 基 本 很 难 考虑 到 这 种 跨 平台 的 支持 。 但 是 ， 
如 果 应 用 程序 需要 直接 接触 硬件 ,无 论 是 因为 功能 的 需求 还 是 性 能 的 需求 , 都 不 得 不 考虑 这 类 问题 。 
要 解决 这 类 硬件 相关 的 可 移植 性 问题 ， 则 需要 对 应 用 程序 的 代码 使 用 分 层 设计 。 这 种 分 层 设 
计 使 代码 的 底层 部 分 是 平台 相关 的 , 而 上 层 部 分 是 平台 无 关 的 。 上 层 部 分 的 代码 可 以 作为 应 用 程序 
的 源 代码 ,同时 并 不 需要 关心 底层 代码 的 实现 , 它 只 关心 与 下 层 代 码 中 的 接口 ; 而 下 层 的 代码 则 把 
对 不 同 硬件 的 操作 封装 成 统一 的 接口 ， 并 通过 依赖 库 的 方式 为 应 用 程序 提供 对 硬件 方面 的 支持 。 


18.3 ”设计 跨 平台 软件 的 原则 


根据 C++ 语 言 可 移植 性 的 特点 和 不 同 平台 下 的 语言 特性 以 及 操作 系统 接口 等 不 同 的 差异 ， 进 
行 跨 平 台 开 发 时 需要 关注 更 多 的 问题 ， 这 一 节 将 讲述 进行 跨 平台 软件 设计 时 的 一 些 原则 。 


18.3.4. 避免 语言 的 扩展 特性 

无 论 使 用 什么 样 的 语言 ， 都 要 避免 使 用 新 的 或 者 高 度 封 装 的 语言 特性 和 代码 库 。 在 这 里 ， 新 
特性 不 仅 是 指 刚 刚 出 现 的 新 技术 , 也 包括 由 于 高 度 的 封装 而 只 能 被 调用 的 这 一 部 分 技术 。 因 为 对 新 
特性 的 支持 ， 往 往 是 有 很 多 故障 的 ， 甚 至 扩展 了 这 种 支持 之 后 ， 仍 然 经 常 出 现 没 有 被 确切 地 测试 和 
精确 定义 的 意外 情况 。 在 对 异常 非常 敏感 的 跨 平台 开发 过 程 中 , 过 分 地 使 用 新 特性 将 会 让 软件 在 排 
除 异 常 时 变 得 十 分 困难 。 因 此 ， 在 实际 的 开发 过 程 中 应 当 使 用 C++ 标准 函数 ， 如 计算 机 环境 的 可 
移植 操作 系统 接口 (Portable Operating System Interface of UNIX，POSIX) ， 从 而 让 所 开发 的 软件 
项 目 或 产品 有 更 高 的 稳定 性 。 


18.3.2 ”实现 动态 的 处 理 

在 实际 的 开发 过 程 中 ， 每 当 编写 一 个 旨 在 多 种 环境 中 运行 的 可 移植 代码 库 时 ， 项 目的 开发 就 
会 不 可 避免 地 面临 一 个 问题 ， 即 怎样 处 理 在 一 个 平台 上 有 而 在 另 一 个 平台 上 没有 的 特性 。 例 如 
Windows 有 树 形 控件 和 递归 互 斥 体 ，DOS 下 没有 线程 ，Linux 下 的 线程 也 是 依据 进程 来 实现 的 ， 这 
是 一 些 典 型 的 特性 示例 ， 某 些 平台 有 ， 某 些 平台 没有 ， 这 就 需要 一 个 跨 平台 代码 库 来 进行 协调 。 

一 种 方法 是 将 抽象 性 直接 映射 为 在 每 一 个 目标 平台 上 可 以 利用 的 具体 实现 方式 。 应 用 程序 可 
以 进行 查询 ， 以 便 了 解 某 个 特性 的 实现 方式 是 否 可 以 利用 ， 如 果 不 存 在 则 不 使 用 它 。 但 是 ， 这 个 方 
法 有 许多 缺点 , 例如 ， 应 用 程序 中 有 着 错综复杂 的 条 件 句 ， 并 且 所 依赖 的 特性 突然 消失 时 ， 这 个 方 
法 的 健壮 性 将 会 变 得 很 差 ， 例 如 : 

Api function functions: // 使 用 平台 的 某 种 特性 

api get function (&functions); // 获 得 特定 平台 的 函数 实现 


if(functions.function x present) 
{ 





// 使 用 一 种 实现 方式 
l 
else if(funcions.function y present) 
t 


// 使 用 另 一 种 实现 方式 
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/如果 需要 使 用 其 他 方法 继续 增加 条 件 
else 
{ 
// 该 平台 不 支持 该 特性 
} 
说 明 当 应 用 程序 试图 处 理 变化 极 大 的 特性 时 , 将 会 出 现 大 量 的 条 件 语句 ,从 而 使 代码 的 复杂 度 
增加 。 
另 一 种 方法 是 完全 不 使 用 偶尔 出 现 的 特性 ， 这 将 极 大 地 简化 开发 过 程 ， 但 是 一 旦 未 被 使 用 的 
et ttn nda gti 
使 用 第 三 方 软件 ， 不 过 正如 之 前 所 论述 的 , 车 使 用 的 第 三 方 软件 不 是 开源 的 , 项 目 中 源 代码 的 未 知 
度 又 会 增加 软件 的 复杂 度 
在 实际 开发 过 程 中 ， 需 要 根据 情况 适当 地 选择 一 种 方法 ， 或 者 两 者 之 间 的 中 间 方 法 ， 即 使 用 
本 地 实现 。 如 果 仿 真 平台 所 缺少 的 特性 并 不 会 给 平台 之 间 带 来 太 大 的 差异 , 例如 最 终 实现 的 功能 在 
性 能 上 不 会 有 几 个 数量 级 的 差别 ， 在 这 种 情况 下 , 采用 本 地 实现 是 更 加 合适 的 选择 同时， 本 地 实 
现 对 抽象 不 同 平台 下 的 代码 库 也 有 着 更 大 的 帮助 。 


18.3.3 ”使 用 脚本 文件 进行 管理 

为 了 使 开发 过 程 中 编写 的 代码 更 加 简单 明了 ， 合 理 地 设计 软件 结构 ， 在 开发 过 程 中 需要 使 用 
脚本 文件 , 在 编译 之 前 就 将 与 平台 相关 的 文件 和 依赖 库 分 离 出 来 ,并 分 配 到 合适 的 位 置 上 。 而 在 应 
用 程序 的 运行 过 程 中 ,也 需要 从 配置 文件 中 读 取 程序 所 需要 的 配置 选项 ,所 以 在 开发 过 程 中 ， 需 要 
尽量 隔离 与 平台 依赖 的 文件 格式 ， 而 采取 更 加 可 控 的 方式 进行 开发 过 程 的 管理 。 

在 跨 平台 的 开发 中 , 使 用 Make 的 编译 策略 是 相对 于 自动 编译 模式 的 更 佳 选 择 ， 原 因 就 在 于 可 
以 完全 控制 编译 过 程 ， 同 时 利用 平台 提供 的 Shell 或 者 Windows 下 的 bat 脚本 在 编译 之 处 就 能 够 判 
定 所 在 平台 的 各 种 参数 。 在 实际 开发 过 程 中 ， 通 常 需要 编写 大 量 的 平台 文件 ， 例 如 图 18-1 所 示 的 
各 种 脚本 文件 。 





mponents.mak 


vendor. registry.mak 


EFRY 





图 18-1 


从 文件 名 字 可 以 看 出 ， 除 了 一 些 必要 的 文件 外 ， 大 多 数 都 是 以 平台 命名 的 ， 而 这 些 依 据 平台 
命名 的 文件 在 make 命令 调用 后 会 提供 平台 下 相应 的 编译 器 配置 以 及 编译 选项 配置 , 为 下 面 的 编译 
提供 相应 的 依赖 。 下 面 是 Make.nt 文件 中 的 一 小 部 分 代码 : 


HHHHHHHHHE HEE EE E EE EE EE EE NE 
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## 环 境 变 量 的 配置 He 


JHOHEHBEHERBBEIHGBHEHHEHHEHBEHHHBEI HE 


# 配置 第 三 方 依赖 库 名 称 及 路 径 


ARCHLIBS:= -W/STACK:OxCOOOOO -m 


ARCHINCLUDE = -I$ (ICUHOME)/include 
FPARITHFLAG:- 

PICFLAG:- 

## 配 置 编译 参数 ## 

override OPTPREFIX:- -0 

override OPTLEVEL:- 

override PCC:= cc 

override CXX cxx-W/TP-W/EHa 
override CC:- cxx-W/TP-W/EHa 
override AR: ar qs 

override TRUE:- $(ROOTDIR) /mksnt/true 


脚 木 文件 的 使 用 不 仅 局 限于 Make 命令 中 makefile 文件 的 编写 上 ,由 于 Windows 自身 和 Linux, 
UNIX 系列 有 着 很 大 的 差别 ， 因 此 还 需要 手动 编写 一 些小 命令 来 达到 平台 间 的 统一 ， 例 如 在 


Windows 上 编写 下 列 命令 。 


€  uname.xe: 返回 当前 平台 的 名 称 ， 例 如 在 Windows 下 返回 Windows NT. 
€ arch.exe: 返回 当前 平台 的 操作 系统 位 数 ， 例 如 PC 机 会 返回 i686 或 32。 
€ cc.exe: 统 一 与 Linux 或 UNIX 下 一 样 的 编译 命令 在 Windows 下 会 自动 链接 到 Visual 


Studio C++ 的 cl 或 者 其 他 的 编译 器 命令 。 
18.34 ”使 用 安全 的 数据 串 行 化 


涉及 跨 平 台 常 见 的 问题 之 一 是 以 安全 、 有 效 地 方式 去 存储 〈 串 行 化 》 和 加 载 〈 反 串 行 化 ) 。 
的 时 候 ， 可 以 始终 使 用 fwiteO/freadO。 但 是 在 跨 平 台 环境 中 ， 这 样 
尤其 是 需要 把 数据 存储 到 文件 以 外 的 目的 地 , 例如 要 存 到 网 络 缓冲 区 
中 ， 不 同 的 字 节 序 和 不 同类 型 的 大 小 会 造成 结果 的 不 统一 。 

可 移植 的 实现 将 串 行 化 分 成 两 部 分 。 首 先是 将 对 象 从 内 在 平台 的 内 存 表示 转换 成 一 个 规范 的 





在 处 理 单个 编译 器 和 目标 平台 
是 不 能 够 做 到 与 平台 无 关 的 ， 


引用 格式 。 这 个 转换 过 程 几乎 是 百 分 百 可 移植 的 ， 例 如 : 


#define MAX NAME LENGTH 50 


typedef struct record 


t 


// 定 义 数 据 结构 


char name[MAX NAME LENGTH]: 


intl6 tpriv: 
)record: 


void serialize record(const record *ur, void *dst bytes) 


t 


/* 在 序列 化 之 前 需要 判定 缓冲 区 大 小 是 否 超过 限制 */ 


uint8 t *dst = 


( uint8 t* ) dst bytes; 


memcpy(dst,ur-»name, MAX NAME LENGTH); 
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dst += MAX NAME LENGTH; 
dst[0] = ( uint8 t) ( ( ur-»priv >>8 ) & OxFF); 
dst[1] = ( uint8 t) ( (ur-»priv >>& OxFF); 
} 
上 述 代码 无 论 运 行 在 什么 平台 上 ，serialize_record 都 会 把 信息 以 相同 的 方式 复制 到 dst bytes 
中 ,在 运行 Linux 的 Power PC 上 被 串 行 化 的 record 所 创建 的 字 节 集合 和 在 运行 Microsoft 的 Pocket 
PC 上 被 串 行 化 的 record 所 创建 的 字 节 集合 完全 相同 。 内 存 中 的 原始 结构 在 不 同 的 平台 上 可 能 具有 
不 同 的 对 齐 、 字 节 存 储 次 序 和 填充 性 质 ， 所 以 在 真正 的 开发 过 程 中 , 还 需要 通过 串 行 化 接口 动态 地 
实现 多 种 方式 ， 常 见 的 做 法 就 是 使 用 多 重 继 承 ， 这 样 类 就 可 以 根据 需要 继承 输出 或 输出 存档 基 类 。 
同时 ， 如 果 可 以 进行 适当 的 预 处 理 , 并 且 可 以 利用 适当 的 运行 时 检查 进行 验证 ,那么 最 终 实现 的 跨 
平台 数据 就 会 有 更 可 靠 的 性 能 ， 从 而 不 会 出 现 不 必要 的 异常 。 


18.3.5” 跨 平台 开发 中 的 编译 及 测试 

跨 平台 的 软件 开发 涉及 修改 和 编写 许多 代码 ， 而 这 些 代码 很 有 可 能 在 相当 长 的 一 段 时 间 内 得 
不 到 在 其 他 平台 上 的 测试 ， 这 意味 着 许多 Bug 将 会 有 相当 长 的 潜伏 期 ， 因 此 进行 多 个 平台 下 的 标 
准 化 测试 至 关 重 要 ， 以 便 尽早 找 出 Bug。 

单元 测试 对 于 这 种 平台 差异 间 的 测试 有 着 很 好 的 效果 ， 它 们 利用 已 知 数据 测试 特定 的 功能 或 
者 子 系统 ,以 确保 每 个 功能 或 子 系统 可 以 按照 预期 运行 。 这 些 测 试 应 该 能 够 立即 发 现在 开发 软件 时 
潜在 的 平台 差异 ， 而 且 当 一 个 特定 的 功能 在 Linux 上 能 运行 ， 而 在 Windows 上 却 无 法 使 用 时 ， 将 
会 迅速 提供 测试 线索 ， 从 而 可 以 尽快 修正 平台 间 的 潜在 隐患。 在 实际 操作 过 程 中 , 编译 选项 以 及 编 
译 断 言 的 合理 使 用 可 以 为 测试 提供 大 量 的 线索 ， 断 言 的 使 用 在 于 避免 不 合理 的 或 者 不 准确 的 假定 ， 
一 旦 这 些 假定 会 产生 异常 ， 就 需要 尽快 修改 这 些 代码 ， 例 如 : 


#define CASSERT(cxp, name) typedef int dummy#name [(exp)? 1:-1]; 
这 样 的 断言 在 执行 下 列 代码 时 : 
CASSERT( sizeof (int) = = sizeof( char ), int as char); 
将 扩展 成 : 
typedef int dummint as char[ -1 ]; 
这 将 产生 一 个 编译 时 的 错误 。 这 个 错误 将 会 提供 一 个 文件 名 与 行 号 可 以 进行 调查 , 显然 这 样 的 
情况 要 比 编译 之 后 出 现 神秘 异常 或 者 在 运行 时 出 现 异 常 方便 管理 得 多 。 
18.3.6 ”实现 抽象 


在 解决 跨 平台 下 应 用 程序 可 移植 性 问题 的 过 程 中 ， 用 到 的 主要 方式 就 是 实现 抽象 。 这 是 一 个 
将 系统 特有 的 元 素 与 较为 普遍 的 体系 结构 隔离 开 来 的 过 程 。 抽象 的 最 终 目的 是 以 一 种 整洁 的 、 与 系 
统 无 关 的 方式 来 编写 主线 代码 。 这 也 是 跨 平台 开发 中 所 要 解决 的 核心 问题 。 

实现 抽象 是 实现 工程 复杂 度 和 代码 复杂 度 的 折 中 ， 尤 其 是 对 于 C++ 语言 的 应 用 程序 而 言 ， 这 
种 抽象 的 实现 方式 更 加 具体 , 究 其 本 质 而 言 ， 抽象 必须 采用 大 量 不 同 的 实现 方式 , 而 且 还 要 涵盖 操 





Linux C 与 C++ 一 线 开发 实践 





作 系 统 接口 API、 函 数 以 及 数据 类 型 3 方面 的 内 容 ， 同 时 ， 函 数 和 数据 类 型 一 定 会 被 要 求 在 应 用 程 
序 中 动态 的 调用 , 否则 代码 的 可 阅读 性 及 维护 性 将 会 大 幅度 的 降低 。 而 系统 接口 函数 则 代表 了 所 在 
系统 的 特性 , 这 些 特 性 往往 只 能 在 其 他 的 系统 中 找到 类 似 的 接口 , 但 是 调用 方式 上 又 会 出 现 一 定 的 
差异 。 例如 , 在 Linux 或 Mac OS X 上 打开 文件 的 函数 是 open( ), 而 在 Win32 下 则 是 _pen( )。 因此， 
在 开发 过 程 中 需要 创造 一 个 包装 函数 来 封装 这 一 过 程 : 

int CrossPlatformOpen(const char * path, int flags, mode t mode); 

在 开发 过 程 中 , 类 似 的 函数 将 会 有 很 多 ,所 以 开发 过 程 中 并 不 会 针对 每 一 个 函数 进行 重新 编写 ， 
封装 将 会 成 为 主要 的 手段 ， 也 就 是 实现 抽象 。 除 此 以 外 , 还 可 以 采取 将 相关 的 文件 123 操作 类 封装 
到 以 操作 平台 命名 的 头 文件 和 源 文件 中 ， 在 调用 之 前 根据 编译 选项 中 的 定义 使 用 相应 类 别 的 头 文 
fp, 或 者 更 直接 一 点 使 用 函数 指针 ,， 不同 的 方法 将 会 使 用 在 不 同 的 环境 中 , 这 取决 于 应 用 程序 的 规 
模 以 及 需求 中 的 细节 。 无 论 采 用 什么 样 的 方法 , 都 是 通过 抽象 的 方式 隐藏 某 一 接口 函数 与 平台 之 间 
的 细节 。 


18.4 ”建立 跨 平台 的 开发 环境 


开发 环境 主要 由 编辑 器 、 编 译 器 和 调试 器 3 部 分 组 成 。 实 现 抽 象 对 于 跨 平台 项 目 开发 至 关 重 
要 , 然而 使 用 平台 相关 的 工具 包 和 库 也 经 常 要 求 适用 平台 相关 的 开发 工具 。 这些 开发 工具 往往 并 不 
是 统一 的 ， 比 如 Linux 上 流行 的 GCC 在 Windows 下 的 使 用 并 不 如 Visual Studio .NET 中 的 C++。 
为 了 做 到 这 一 点 , 就 需要 使 用 抽象 以 及 相关 的 设计 模式 (如 编译 器 工厂 等 ) 来 提供 一 种 独立 于 平台 
的 开发 方式 ， 使 之 更 好 地 支持 不 同 平台 下 项 目的 编译 。 


18.41 ” 跨 平台 开发 编译 器 的 选择 


相 比 于 跨 平台 编译 器 , 更 应 该 使 用 目标 平台 上 支持 最 好 的 编译 器 和 链接 器 , 例如 , 在 Windows 
上 使 用 Visual C++， 在 AIX 中 使 用 XLC， 而 在 大 多 数 UNIX 和 Linux 系列 平台 上 使 用 GUN g++。 
没有 理由 为 了 生产 出 跨 平 台 支 持 的 代码 而 把 所 有 平台 的 编译 器 都 固定 在 某 一 个 编译 器 上 。 

这 种 选择 包含 多 方面 的 原因 。 首 先 ， 目 前 还 没有 一 款 编译 器 能 够 在 多 元 化 的 平台 上 有 着 出 色 
的 开发 工具 合集 ， 即 使 是 GNU 家 族 的 GCC 在 Windows 上 也 只 是 一 些 基本 开发 工具 的 集合 ， 并 没 
有 像 在 Linux 系列 平台 下 那样 庞大 的 依赖 库 。 其 次 , 使 用 目标 平台 下 支持 最 好 的 编译 器 可 以 给 予 平 
台 本 身 更 好 的 支持 和 性 能 。 再 次 ， 当 项 目 使 用 不 同 的 编译 器 时 ,代码 里 编译 器 相关 的 成 分 (依赖 于 
特定 编译 器 的 标志 和 编译 器 中 的 扩展 性 能 ) 会 大 大 减少 。 因为 使 用 编译 器 相关 特性 的 代码 在 没有 提 
供 这 个 特性 的 编译 器 上 编译 一 定 会 失败 , 使 用 不 同 的 编译 器 后 , 还 可 以 暴露 不 同 的 编译 器 在 特定 平 
台 下 的 编译 警告 和 错误 ， 这 样 更 有 助 于 发 现 潜在 Bug。 关 键 在 于 ， 在 使 用 平台 支持 的 最 好 的 编译 器 
的 同时 ， 只 要 能 保证 应 用 程序 中 公共 部 分 的 代码 遵循 C 和 C++ 标准 ， 而 这 些 标 准 由 被 锁 选 择 的 编 
译 器 所 支持 , 并 且 通 过 合适 的 抽象 把 平台 相关 的 代码 封装 起 来 , 所 开发 的 代码 自然 拥有 良好 的 可 移 
植 性 ， 从 而 使 跨 平 台 的 开发 更 加 高 效 ， 同 时 也 保证 了 最 终 代 码 的 健壮 性 。 
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18.4.2 ”建立 跨 平台 的 Make 系统 


在 跨 平台 的 项 目 开发 过 程 中 ， 如 果 使 用 IDE 来 自动 化 整个 软件 的 编译 过 程 ， 例 如 使 用 微软 
Visual Studio EÈ Apple Project Builder 等 ,我 们 可 能 根本 不 了 解 自己 所 开发 的 源 代码 在 编译 过 程 中 选 
择 了 哪些 编译 选项 、 是 如 何 链接 在 一 起 的 。 这 样 就 会 使 软件 项 目 失去 可 移植 性 ， 因 此 使 用 命令 行 调 
用 编译 器 是 跨 平台 软件 开发 的 绝 佳 选择 。 


1. 使 用 Make 生成 策略 

Make 在 Linux 与 UNIX 下 已 经 存在 了 很 长 一 段 时 间 ， 同 时 已 经 成 为 这 两 种 操作 系统 在 C++ 语 
言 开 发 环境 下 编译 的 主要 方式 。 通 过 手动 编写 Makefile 文件 来 制定 源 代码 的 编译 规则 ， 这 种 更 直 
接 的 编译 方式 为 跨 平台 的 开发 提供 了 更 好 的 可 控 性 。 

举例 来 说 ,假设 在 Linux 平台 下 正在 编写 一 个 名 字 为 myApp 的 应 用 程序 ， 它 由 myApp.cpp 和 
main.cpp 两 个 C++ 源 文件 和 一 个 myApp.h 头 文件 组 成 。 在 完成 代码 部 分 的 编写 以 后 ， 源 代码 需要 
被 转换 成 一 种 平台 下 可 读 的 方式 ， 即 二 进 制 格式 , 并 对 外 生成 一 个 可 以 运行 的 接口 命令 。 如果 直接 
调用 g++ 命令 ， 对 于 这 个 小 程序 来 说 ， 可 以 很 容易 地 实现 : 





g++ -g -o myApp myApp.cpp main.cpp 

随后 就 会 生成 example 命令 ,而 这 个 小 程序 中 的 源 代码 就 可 以 在 平台 中 实现 , 但 是 对 于 一 个 复 
杂 的 应 用 程序 ， 需 要 编译 的 文件 有 很 多 ， 而 且 有 些 文件 需要 编译 成 动态 库 而 有 些 需要 编译 成 命令 ， 
因此 需要 使 用 Make 系统 来 完成 这 些 复 杂 的 编译 过 程 。 还 是 以 example 程序 为 例 ， 首 先 编写 一 个 名 
字 为 makefile 的 文件 ， 这 个 文件 是 make 命令 执行 所 必需 的 文件 ， 里 面 定义 了 Make 的 具体 规则 : 

myApp: myAppxpp main.cpp 

g++ -g -o myApp myApp.cpp main.cpp 

有 了 这 样 一 个 makefile 文件 后 ， 只 需 再 输入 make 命令 ， 然 后 make 就 会 生成 myApp 的 程序 。 
同时 ,在 使 用 makefile 定义 规则 后 ， 跨 平台 的 项 目 还 会 得 到 更 加 灵活 的 编写 方法 ， 即 如 果 只 有 一 个 
源 文件 被 修改 ，make 会 根据 文件 的 修改 时 间 而 只 编译 这 个 被 修改 的 文件 ， 并 不 会 将 所 有 的 源 文件 
都 同时 编译 。 当 然 , 为 实现 这 样 的 目标 , 还 需要 修改 一 下 makefile 文件 来 确定 它们 之 间 的 一 些 依赖 
关系 : 


myApp: myApp.o main.o 

g++ -g -o myApp myApp.o main.o 
myApp.o: myApp.cpp myApp.h 
gt* -g -c myApp.cpp 

main.o: main.cpp myApp.h 

g++ -g -c main.cpp 


在 修改 makefile 文件 以 后 , 通过 引入 两 个 新 目标 解决 了 依赖 性 的 问题 , 而 当 没 有 依赖 的 源 文件 
发 生 改变 时 ，make 就 不 会 同时 编译 这 个 文件 。 在 下 面 的 论述 中 ，make 可 以 带 来 的 灵活 性 和 解决 的 
问题 还 有 很 多 ， 不 过 在 此 之 前 ， 先 讨论 如 何在 Windows 平台 下 使 用 Make 策略 。 





Linux C 与 C++ 一 线 开发 实践 





2. Windows 平台 与 nmake 


于 微软 提供 的 编译 工具 Visual Studio .NET 在 Windows 系列 平台 上 有 着 绝对 统治 地 位 ,Make 
的 生成 策略 并 没有 被 广泛 使 用 ， 甚 至 很 多 Windows 的 开发 人 员 并 不 懂得 如 何 添加 编译 选项 ， 或 者 
使 用 Make 将 源 代码 编译 成 程序 .然而 事实 上 Windows 中 确实 存在 一 种 命令 行 的 编译 方式 ,与 GUN 
的 make 生成 策略 类 似 (nmake) 。 然 而 ， 虽 然 这 种 方式 与 GNU make 使 用 起 来 几乎 完全 相同 ， 但 

是 它们 之 间 却 有 着 不 同 的 规则 ， 这 些 规则 的 差异 源 于 平台 的 自身 因素 ， 也 源 于 Windows 下 开发 工 
具 的 差异 ， 如 图 18-2 所 示 。 




















icrosoft (R) Program Maintenance Utility Version 18.3077 
copyright (C) Microsoft Corporation. All rights ved. 


-e nyñpp -cpp 
-hit C/C++ Optimizing Conpiler Version 13 
copyright <C) Microsoft Corporation 1984 982. R11 right 
mand line warning D4824 : unrecognized source file type ' - g', object f 
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tax e 


return code 





图 18-2 


由 图 18-2 可 以 得 出 nmake 在 Windows 中 确实 存在 , 而 它 与 GNU make 之 间 的 差异 也 同步 存在 。 
仅 对 于 这 个 例子 而 言 ，nmake 中 编译 的 命名 是 cl 而 非 gt+， 同 时 它们 也 不 支持 -g 或 者 -c 的 编译 选 
项 ， 而 与 之 相对 的 选项 是 /Zi， 除 此 之 外 ，.o 的 文件 格式 也 不 是 Windows 下 的 文件 格式 ， 而 .obj 的 
文件 格式 才 是 。 为 此 ， 需 要 为 Windows 与 Linux 之 间 编 写 一 个 合适 的 Makefile 文件 ， 在 文件 中 引 
入 变量 , 根据 平台 的 不 同 动态 改变 这 x 此 平台 间 的 差异 。 然 而 ， 随 着 项 目的 复杂 性 不 断 增高 ， 或 者 需 
要 支持 的 平台 不 断 增 加 ， 库 与 库 之 间 的 差异 使 得 创建 和 维护 跨 平台 的 Makefile 和 软件 变 得 困难 起 
来 ， 编 译 器 和 链接 器 的 标志 往往 互 不 相同 ， 因 此 跨 平 台 的 项 目 需要 统一 Make 机 制 ， 同 时 编写 脚 
本 文件 配合 Makefile 来 管理 不 同 平台 之 间 的 差异 ， 从 而 建立 一 个 跨 平台 的 Make 系统 ,而 这 个 系统 
的 核心 在 于 在 Windows 平台 下 实现 一 个 Linux 的 Make 策略 。 

3. 在 Windows 下 使 用 GNU make 

在 跨 平台 的 软件 开发 中 , 开发 环境 必须 能 够 同时 适用 Windows. Linux 和 UNIX 等 几 大 主流 平 
台 ， 而 由 于 Windows 的 操作 平台 并 不 是 一 个 以 丰富 命令 行 工具 为 核心 的 主流 平台 ， 其 自身 提供 的 
nmake 也 与 UNIX 或 Linux 系列 中 的 Make 有 着 很 大 的 差别 ,因此 在 开发 过 程 中 ,不 得 不 在 Windows 
平台 上 使 用 第 三 方 软件 来 支持 这 种 模式 的 编译 方式 ， 即 在 Windows 上 实现 Linux 的 环境 。 主 流 有 
以 下 两 种 方式 。 

1. 使 用 Cygwin 

Cygwin 始 于 1995 年 ， 包 括 3 部 分 : 
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(D 一 个 动态 链接 库 (Dynamic Link Library; DLL) 。 这 个 动态 链接 库 实 现 了 绝 大 多 数 UNIX 
程序 员 熟 悉 的 核心 API (POSIX) 。 

(2) 需要 上 述 DLL 来 执行 的 开源 UNIX 库 。 

(3) 一 个 以 二 进 制 发 布 的 丰富 的 UNIX 命令 行 语言 工具 套件 ， 这 个 套件 也 包括 GCC 等 开发 
工具 。 


Cygwin 的 DLL 库 以 及 工具 集合 都 是 用 来 帮助 开发 人 员 在 Windows 上 重新 编译 UNIX 命令 行 
应 用 程序 的 ， 而 同时 Cygwin 也 支持 在 Windows 上 编写 Shell 脚本 程序 ， 这 些 对 于 建立 一 个 跨 平 台 
的 开发 环境 都 起 着 关键 作用 。 
2. 使 用 MKS Toolkits 
和 Cygwin 一 样 ,MKS Toolkits 工具 集 也 能 够 实现 Windows 平 台 上 的 Linux 系统 ,然而 和 Cygwin 
不 同 的 是 ，MKS Toolkits 系列 的 产品 是 一 个 以 付费 为 主 的 软件 ， 作 为 付费 软件 ， 它 几乎 能 够 让 
Windows 实现 Linux 系统 的 任何 操作 CX WINDOW 除外 ) 。 这 款 第 三 方 软件 也 有 免费 的 工具 集 ， 
如 MKS Toolkit ForDeve, 它 包 含 GNU make 以 及 项 目 编译 过 程 中 所 需要 的 一 些 脚本 命令 行 ,图 18-3 
显示 了 部 分 MKS 工具 集 所 提供 的 命令 。 
less.exe regps .ksh viv.exe 
libea resh.exe viw.hlp 
line. B rev.exe viuf.fon 
jn .exe rexec.exe 
lognane .exe rexecd.exe 
look.exe ripendi68sun.sh 
ls .exe rlogin.exe wcopy.exe 
lsacl.exe rn.exe web e 
isshare .exe rndir.exe vhereis.exe 
n4.exe rnshare .exe which.exe 
mailx.exe etup.exe who .exe 


h.exe winctrl.exe 
windir .exe 


manstrip-exe 


mapimail.sh 


zipinfo -exe 





n Piles KS Toollit\n 
图 18-3 


无 论 是 Cygwin 还 是 MKS Toolkits， 都 可 以 在 Windows 下 提供 Linux 的 GNU make 以 及 所 必 
需 的 Shell 脚本 编写 的 功能 ， 而 跨 平台 的 开发 环境 也 正 需要 这 两 者 的 支持 。 对 于 两 者 之 间 的 选择 并 
不 是 绝对 的 ， 虽 然 Cygwin 不 是 付费 产品 ， 但 是 它 完全 能 够 提供 所 需要 的 功能 ， 而 且 并 不 需要 过 多 
的 工作 量 去 搭建 环境 ， 关 键 的 问题 在 于 能 和 否 将 这 些 工 具 集 合理 的 应 用 。 
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4. 跨 平台 的 Make 系统 

在 确保 开发 平台 可 以 使 用 同一 make 编译 以 后 , 这 部 分 将 会 把 核心 放 在 Makefile 文件 的 编写 以 
及 配合 Shell 的 脚本 实现 跨 平台 的 编译 环境 上 , 一 个 跨 平台 Makefile 的 编写 要 更 加 注重 其 动态 的 特 
性 ， 保 证 其 在 各 个 平台 之 间 编 译 的 同时 做 到 最 小 的 改动 量 ， 所 以 需要 在 这 个 Makefile 中 引入 变量 。 





include make .arch 

include make.$ (ARCH) 

# 注 释 中 的 这 些 定义 会 在 nake.$ (ARCH) 这 个 脚本 中 实现 ， 以 windows 为 例 
#CXX = cl 

#OBJS = myApp.obj main.obj 
#CXXFLAGS = /Zi 

myApp: $(OBJS) 

$ (CXX) (CXXFLAGS) $ (OBJS) 
$.0bj :$cpp 

$(CXX) (CXXFLAGS) -c $« 
$(OBJS): myApp.h 


经 过 这 样 的 修改 之 后 ，Makefile 的 编译 规则 就 变 得 更 加 灵活 ， 而 下 面 需要 做 的 是 添加 变量 的 赋 
值 部 分 ,将 其 移 至 另 一 个 脚本 文件 中 ， 然 后 通过 平台 判定 调用 这 些 不 同 的 文件 ， 使 其 能 够 在 不 同 平 
台 下 赋予 相应 的 值 。 所 以 ， 在 完成 Makefile 中 编译 部 分 的 工作 以 后 ， 还 需要 编写 一 些 其 他 的 脚本 
文件 。 在 这 个 例子 中 , 至 少 还 需要 三 种 文件 , 一 是 用 于 判定 平台 及 操作 系统 位 数 的 Make.arch 文件 ， 
二 是 以 各 个 平台 命名 的 用 于 配置 编译 命令 及 编译 选项 的 一 系列 文件 , 例如 Make.nt、Make.linux 等 ， 
三 是 在 复杂 的 软件 项 目 中 还 需要 一 个 用 于 配置 链接 库 的 文件 Make.library o 

在 这 个 例子 中 ，Make.nt 的 内 容 如 下 : 

CXX : = cl 


OBJS:= myApp.obj main.obj 
CXXFLAGS: - /Zi 


Make.linux 的 内 容 如 下 : 


CXX := g++ 
OBJS := myApp.o main.o 
CXXFLAGS: = -g 


若 操作 系统 为 AIX 的 64 位 系统 ， 则 可 定义 Make.aix64 如 下 : 


CXX:-Xlc r 
OBJS:-myApp.o main.o 
CXXFLAGS:--g-q64 


在 调用 make 命令 以 后 ， 这 些 脚本 的 工作 流程 如 图 18-4 所 示 。 
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Nakefile = Make. library 


图 18-4 





通过 关键 字 include 引入 这 些 脚本 文件 ， 使 其 在 Makefile 制定 的 编译 过 程 之 前 配置 完成 所 需要 
的 各 种 变量 。 然 而 通过 这 种 方式 解决 平台 间 的 差异 还 需要 充分 地 了 解 Makefile 文件 编 了 的 规则 ， 
对 于 一 个 复杂 的 应 用 程序 , 开发 时 所 包含 的 不 仅仅 是 编译 目标 文件 和 链接 依赖 库 ， 
资源 文件 , 涵盖 所 需 的 配置 文件 ， 还 要 为 应 用 程序 提供 运行 过 程 中 用 户 操 作 ti 在 
实际 开发 的 过 程 中 ,一 套 Make 生成 策略 所 需要 做 的 工作 并 没有 例子 中 这 么 简易 ， 尤 其 是 针对 跨 平 
台 的 开发 , 需要 大 量 的 编译 条 件 , 并 通过 不 同 的 条 件 引入 相应 的 编译 配置 。 以 平台 判定 的 部 分 为 例 ， 
在 nbi pai 不 复杂 ， 首 先 在 Windows 平台 下 需要 实现 uname 命令 ， 这 个 命令 返回 的 


是 当前 的 平台 名 称 ， 而 随后 大 . 量 的 工作 都 会 集中 在 条 件 判 定 上 ， 图 18-5 显示 了 该 脚本 程序 的 一 部 
分 。 























SUPPORTED ARCHITECTURE: "true 


ifeq 《0SF1 .SCUNAME_NORRG>> 


UPPORTED_ARCHITECTURE: 


4I TECTURE: =t rue 
<shell arch? 


ifeq <i586,$<ARCH)) 


" Note that we lose the fact this was i586. 


ED ARCHITECTURE: =t rue 


86. $<ARCH 
linux 


ORTED ARCHITECTURE: 
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随 着 平台 支持 数量 的 增加 ， 这 部 分 的 代码 结构 会 变 得 更 加 复杂 ， 而 在 实现 平台 的 成 功 判定 之 
后 ，Makefile 的 工作 也 才刚 刚 开 始 ， 首 先 需要 为 每 一 个 支持 的 平台 配置 相应 的 make 文件 ， 这 部 分 
文件 已 经 在 图 18-1 中 显示 出 来 ， 而 之 后 由 于 跨 平台 开发 过 程 中 需要 建立 自己 的 可 移植 代码 库 ， 因 
此 需要 配置 的 链接 库 也 会 相应 地 增加 ,同时 ,在 项 目的 编译 过 程 中 ,也 需要 按照 依赖 的 顺序 逐 层 编 
译 每 一 个 阶段 的 源 文件 , 而 这 些 工作 需要 根据 项 目的 实际 情况 合理 地 设计 编译 规则 。 因 此 ,这 部 分 
工作 的 进行 需要 同步 甚至 提前 于 应 用 程序 的 开发 阶段 ， 即 当 应 用 程序 框架 已 经 搭建 完成 时 ， 
Makefile 生成 策略 的 文件 在 这 个 阶段 应 该 已 经 基本 完成 , 并 可 以 用 于 测试 。 这 样 不 仅 可 以 为 多 个 平 
台 下 的 测试 提供 条 件 ， 而 且 会 使 这 部 分 的 工作 量 不 会 由 于 项 目的 异常 庞大 而 变 得 无 法 设计 。 


18.5 ”C++ 语言 跨 平 台 软 件 开发 的 实现 


一 个 跨 平 台 软 件 产品 的 开发 和 实践 关键 在 于 对 开发 过 程 的 整体 设计 ， 在 实现 平台 无 关 的 代码 
的 基础 上 ， 还 要 对 软件 的 配置 与 架构 有 合理 的 设计 。 图 18-6 展示 了 其 主要 流程 。 





配置 vindovs 
平台 编译 参数 








配置 Linux 系 列 配置 Unix 系 列 
平台 编译 参数 平台 编译 参数 











生成 . so 文件 





图 18-6 


而 开发 公共 代码 的 内 容 涉 及 多 方面 的 问题 ， 从 源 文件 的 文件 格式 到 C/C++ 语言 的 代码 设计 。 
总 之 ， 能 被 不 同 平 台 共享 的 代码 越 多 ， 跨 平台 的 项 目 就 越 趋 于 成 功 。 所 有 平台 上 公共 的 功能 应 该 被 
标识 出 来 ,避免 它们 在 平台 相关 的 代码 里 重复 出 现 , 在 跨 平台 开发 的 过 程 中 , 需要 根据 各 个 差异 的 
类 别 建立 一 个 能 够 被 重复 调用 的 代码 库 , 同时 还 要 在 程序 的 运行 过 程 中 进行 必要 的 安全 检查 , 动态 
地 控制 不 同 平台 之 间 代 码 的 使 用 。 图 18-7 以 一 线 开发 中 的 项 目 为 例 说 明 这 部 分 代码 的 设计 思路 。 
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功能 模块 实现 


i} 工厂 模式 
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平台 相关 代码 <H eTEN 


UNIX 平 台 下 实现 


图 18-7 














18.6 ”C++ 语言 跨 平台 的 开发 策略 


在 开始 编写 代码 之 前 ， 首 先 要 规定 源 代码 在 文本 编写 过 程 中 的 编辑 策略 ， 在 不 同 的 操作 系统 
中 创建 和 编辑 文本 文件 必然 涉及 多 种 类 型 的 行 结束 符 。DOS 和 Windows 使 用 回 车 /换行 对 Orn) 
作为 行 结束 的 标志 ，UNIX 使 用 换行 符 Qu). 。 当 在 这 些 平台 之 间 编 写 源 代 码 的 时 候 ， 这 就 成 为 一 
个 问题 。 如 果 一 个 文件 是 在 UNIX. 下 创建 的 , 那么 在 Windows 计算 机 上 很 可 能 不 会 被 正确 的 编辑 。 
此 外 ， 不同 平 台 间 Tab 的 间距 也 有 着 不 同 的 定义 ， 因 此 在 编写 代码 的 过 程 中 ， 需 要 规定 统一 的 Tab 
与 行 结束 符 ， 从 而 保证 代码 的 阅读 性 在 各 个 平台 间 都 是 相同 的 。 所 以 在 开发 的 初期 , 需要 针对 这 个 
问题 制定 两 点 规则 : 


(1) 统一 使 用 4 个 空格 键 来 代 蔡 Tab， 也 就 是 \t 格式 。 
(2) Windows 下 的 源 文件 代码 需要 存储 成 UNIX 的 文件 格式 , 或 者 在 Windows 下 的 文件 编写 
完成 之 后 ， 通 过 dos2unix 命令 实现 文本 格式 的 转换 。 


目前 来 讲 ， 这 部 分 的 问题 还 有 一 个 更 简易 的 解决 方式 一 一 使 用 Emacs 编辑 器 ，Emacs 虽然 没 
有 久远 的 历史 , 但 是 它 已 经 迅速 得 到 了 广泛 的 应 用 ,原因 在 于 其 独特 的 开发 方式 , 编辑 人 员 几 乎 可 
以 完全 放弃 使 用 鼠标 而 专心 使 用 键盘 来 完成 自己 的 代码 ,同时 它 对 几乎 任何 一 个 平台 都 能 给 予 很 好 
的 支持 ， 并 且 非 常 易于 安装 ， 甚 至 有 很 多 开发 人 员 视 Emacs 为 一 种 编写 源 代码 的 理念 ， 而 远 超 于 
一 个 简单 的 编辑 器 。 

在 进入 开发 阶段 以 后 ， 需 要 跟随 项 目的 进度 ， 保 持 在 不 同 平台 上 编译 代码 的 习惯 ， 由 于 在 跨 
平台 的 开发 过 程 中 选择 了 不 同 的 编译 器 作为 不 同 平台 下 的 开发 工具 , 通过 这 种 方式 可 以 为 跨 平 台 的 
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软件 开发 带 来 很 多 好 处 ， 例 如 : 


(1) 可 以 帮助 开发 人 员 避 免 使 用 编译 器 相关 的 特性 、 标 志和 宏 。 

(2) 把 对 C/C++ 标准 不 同 解读 的 影响 减 到 最 小 ， 并 可 以 避免 使 用 未 经 证 明 的 语言 特性 。 

(3) 每 种 编译 器 在 不 同 的 平台 上 会 产生 不 同 的 错误 和 警告 ， 这 会 使 开发 人 员 编 写 出 更 强壮 的 
代码 ， 最 大 化 地 避免 潜在 的 问题 。 


此 外 , 在 实际 开发 过 程 中 ,如 果 没 能 切实 保证 代码 在 提交 前 可 以 在 所 有 支持 的 平台 上 编译 , 那 
么 最 终 一 定 会 产生 架构 上 的 问题 。 假设 有 一 个 需要 平台 相关 具体 实现 的 抽象 类 , 如 果 在 完成 以 后 才 
发 现 不 能 在 某 一 个 平台 上 成 功 编译 或 运行 ， 那 么 这 个 问题 可 能 会 导致 这 个 抽象 类 需要 整体 重新 设 
计 ， 在 跨 平 台 的 开发 过 程 中 ， 代 码 的 结构 往往 十 分 复杂 ， 而 这 样 的 错误 会 导致 工作 幅度 大 幅 增加 。 


18.7 ”建立 统一 的 工程 包 


一 个 多 元 平台 下 的 软件 产品 在 开发 过 程 中 需要 保证 各 个 源 代码 以 及 配置 文件 、 依赖 库 的 移植 性 ， 
只 有 这 样 才 可 以 做 到 ， 当 一 个 Linux 平台 下 开发 的 工程 包 被 移植 到 另 一 个 平台 上 时 ,可 以 直接 对 其 编 
译 或 者 使 用 。 和 否则 ， 一 个 工程 包 在 移植 到 其 他 平台 以 后 ， 还 需要 进行 大 规模 的 编辑 ， 这 样 不 但 影响 
软件 开发 的 进度 ， 还 会 影响 该 项 目 在 各 个 平台 之 间 的 一 致 性 ， 长 期 的 改动 将 会 直接 导致 项 目 没有 任 
何 可 维护 性 。 因 此 ， 在 整个 开发 周期 中 ， 必 须 保证 各 个 平台 下 所 使 用 的 开发 工程 包 是 完全 统一 的 。 


18.8 建立 跨 平台 的 代码 库 


由 于 C++ 语言 的 语言 特性 及 其 标准 在 各 个 平台 、 编 译 器 上 的 不 同 定义 ， 跨 平台 的 软件 开发 需 
要 更 合理 的 代码 规划 ,一 定 要 明白 ,抽象 是 真正 实现 代码 跨 平台 的 核心 , 没有 适当 的 抽象 很 难 构建 
一 个 跨 平 台 的 应 用 程序 。 抽象 在 C++ 里 普遍 的 使 用 ，C++ 的 标准 模板 库 (Standard Template Library, 
STL) 和 Boost 是 两 个 很 好 的 例子 。Boost 标准 类 随 着 其 被 不 断 完 善 ， 可 以 帮助 一 个 跨 平台 的 产品 
解决 操作 系统 库 内 各 个 接口 的 差异 , 但 是 还 不 能 够 解决 所 有 的 问题 , 一 方面 它 目前 并 没有 涵盖 所 有 
的 范畴 ， 另 一 方面 由 于 它 的 封装 使 项 目 又 增加 了 不 确定 性 ， 而 在 STL 中 并 不 是 所 有 的 模板 都 有 着 
很 高 的 可 移植 性 , 在 可 能 的 情况 下 , 笔者 更 倾向 于 自己 手动 编写 所 需要 的 各 个 抽象 类 。 进一步 而 言 ， 
即使 这 些 标准 库 可 以 被 完全 使 用 ， 然 而 这 对 于 一 个 跨 平 台 的 软件 项 目 来 说 还 是 远 远 不 够 的 。 所 以 ， 
在 项 目 开 发 过 程 中 需要 编写 自己 的 抽象 库 ， 随 着 开发 的 不 断 进展 ， 根 据 需 求 的 变化 结合 C++ 语言 
的 语言 特性 设计 这 部 分 代码 。 
建立 一 个 跨 平台 的 抽象 库 需 要 借助 设计 模式 的 思想 合理 地 设计 ， 使 最 终 抽象 出 的 代码 库 更 像 
是 一 个 产品 ， 它 不 仅仅 用 在 一 个 软件 项 目 上 , 而 且 应 该 时 时 进行 更 新 维护 , 根据 不 同 的 需求 给 予 跨 
平台 开发 更 好 的 支持 。 在 实际 的 操作 中 ,这 是 一 个 问题 ， 它 更 多 的 是 在 设计 软件 架构 的 过 程 中 出 现 
的 问题 结合 工程 师 自 身 经 验 的 产物 。 而 关于 C++ 语言 的 部 分 也 有 着 更 多 考虑 ， 例 如 字符 串 的 处 理 、 
文件 的 读 写 、 浮 点 数 的 使 用 等 ， 在 必要 的 情况 下 ， 还 需要 对 C++ 语言 的 内 建 函 数 进 行 封装 ， 换 名 
话说 ， 使 用 自己 定义 的 变量 来 确保 代码 的 确定 性 。 
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18.9 工厂 模式 与 单 例 模式 的 实现 


在 跨 平台 开发 的 过 程 中 , 工厂 模式 与 单 例 模式 的 使 用 有 着 重要 的 意义 ,， C++ 语言 的 代码 有 着 诸 
多 的 特性 不 被 多 元 化 的 平台 所 共享 。 因此, 工厂 模式 通常 需要 在 代码 库 中 抽象 出 这 部 分 的 代码 , 然 
后 分 别 在 Windows. Linux. UNIX 平台 下 通过 各 自 的 方式 实现 ， 再 通过 条 件 编译 来 动态 地 调用 不 
同 平台 下 的 函数 ; 而 单 例 模式 则 是 为 了 保证 每 一 个 类 在 程序 中 只 有 一 个 对 象 被 实例 化 , 防止 过 多 的 
实例 间 产 生 冲 突 。 这 两 种 设计 模式 的 实现 需要 利用 面向 对 象 的 思想 , 通过 继承 来 实现 这 种 多 平台 的 
多 态 性 ， 除 此 之 外 ， 跨 平台 的 工厂 模式 还 需要 利用 条 件 编译 来 实现 动态 的 调用 。 








18.10 ”利用 平台 依赖 库 封装 平台 相关 代码 


在 实际 的 开发 过 程 中 ， 对 于 应 用 程序 的 核心 功能 ， 还 可 以 在 编译 过 程 中 通过 链接 不 同 的 依赖 
库 来 处 理 C++ 语言 跨 平 台 开 发 过 程 中 平台 相关 的 代码 。 这 种 方法 的 核心 在 于 把 平台 相关 的 各 部 分 
代码 在 不 同 的 平台 下 实现 并 封装 成 依赖 库 , 然后 在 不 同 的 平台 下 调用 不 同 的 依赖 库 以 达到 统一 代码 
的 目的 。 这 种 方法 首先 需要 在 编译 时 定义 一 个 编译 选项 变量 REQUIRED_LIBRARIES, 然后 根据 不 
同 的 平台 赋予 这 个 变量 不 同 的 值 ， 从 而 统一 添加 到 编译 选项 中 。 而 对 于 代码 的 处 理 ,， 则 定义 一 个 头 
文件 , 在 这 个 头 文件 中 定义 处 理 这 些 核心 处 理 函 数 的 统一 接口 ,而 这 些 接口 的 实现 则 体现 在 不 同 平 
台 下 的 依赖 库 中 。 也 就 是 说 ， 可 以 先 将 这 些 核心 的 功能 编译 出 来 ， 然 后 通过 依赖 库 添 加 到 应 用 程序 
中 。 具 体 的 实现 以 曾经 开发 的 一 个 项 目 为 例 来 介绍 。 

在 这 个 项 目 中 ， 核 心 的 处 理 就 是 针对 地 址 的 比 对 ， 而 这 些 比 对 在 不 同 的 平台 下 会 有 不 同 的 实 
现 方式 , 考虑 到 代码 效率 和 代码 结构 的 问题 , 采用 这 种 链接 库 的 方式 可 以 提高 运行 效率 ,同时 合理 
优化 代码 。 在 实现 的 过 程 中 ， 首 选 需要 定义 一 个 头 文件 Address.h， 在 这 个 头 文件 中 包含 对 这 些 接 
口 的 统一 定义 。 代 码 示例 如 下 

首先 ， 需 要 针对 不 同 平台 在 链接 动态 库 时 的 不 同 规则 定义 关键 字 : 

#if defined( WIN32) | | defined( WTN64 ) 

//! 针 对 Windows 平 台 下 关键 字 declspec (dllexport) 的 定义 

define AD EXPORTCALL 1 declspec (dllexport) 

//! 针 对 Windows 平 台 下 关键 字 stdcal1 的 定义 

#define AD EXPORTCALL2 stdcall 

#else 

#define AD EXPORTCALLl 


#define AD EXPORTCALL2 
#endif //define( _WIN32) || define( _W1N64 ) 


随后 ， 头 文件 中 的 函数 接口 会 被 定义 成 如 下 形式 : 


AD EXPORTCALL1 AD StatusCodc AD EXPORTCALL2 AD GetConfigSettingsXMLW( 
AD WCHAR* const psConfigXMLOutputBuffer, 
//!« [out] Pointer to output buffer; optional parameter, may be NULL 
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const AD U32 ulConfigXMLOutputBufferSize 
//!« [in] Size of the output buffer in number of characters inch the terminating 
zero); 


其 中 ，AD EXPORTCALLI 和 AD EXPORTCALL2 就 是 在 之 前 定义 的 关键 字 ， 其 主要 目的 是 
实现 不 同 平台 下 对 动态 库 中 函数 调用 的 差异 ， 例 如 Windows 平台 下 需要 引入 _declspec(dllexport)。 
随后 ， 通 过 在 不 同 平台 下 的 编译 实现 这 些 接口 函数 ， 并 编译 出 不 同 平台 格式 的 库 文件 ， 例 如 
Address.dll, libAddress.so 等 。 在 有 了 这 些 库 文 件 函数 之 后 ， 跨 平台 的 部 分 已 经 基本 完成 ， 下 面 在 
应 用 程序 的 代码 中 引入 头 文件 Addressh， 然 后 在 编译 的 过 程 中 加 入 文件 Make.library， 用 于 控制 不 
同 动态 库 的 链接 ， 其 内 容 如 图 18-8 所 示 。 


ifeq(Windows_NT, $ (Shell uname)) 

REQUIRED LIBRARIES-$ (QSAVINST) /1ib/Address. lib 
else 

ifeq(Linux, $ (shell uname)) 

REQUIRED LIBRARIES-$ (PX LIBRARIES) 





$(QSAVINST) /1ib/libAddress. so 


else 

ifeq(AIX, $ (shell uname)) 

REQUIRED LIBRARIES-$ (PX LIBRARIES) 
-L$(QSAVINST)/lib -lAddress 


图 18-8 


这 样 ， 同 样 的 接口 在 不 同 的 平台 下 就 可 以 被 引入 不 同 的 动态 库 ， 从 而 使 平台 不 相关 的 实现 不 
体现 在 应 用 程序 的 源 代码 中 。 这 种 方法 适用 于 对 应 用 程序 核心 功能 的 处 理 ， 因 为 不 论 在 什么 平台 ， 
应 用 程序 都 需要 做 出 同样 的 处 理 , 使 用 同样 的 接口 。 而 在 运行 的 效率 上 ， 由 于 这 种 方式 不 需要 大 量 
的 条 件 判断 ， 在 程序 初始 化 的 过 程 中 ， 这 些 链接 库 就 会 被 调 进 内存 中 ,这 样 一 方面 可 以 提高 运行 效 
率 ， 另 一 方面 可 以 优化 代码 的 结构 ， 有 效 地 优化 C++ 语言 跨 平 台 的 应 用 程序 。 





18.11 ”处 理 器 的 差异 控制 


处 理 器 的 差别 在 于 存储 要 求 〈 数 据 对 齐 、 字 节 排 序 ) 、 数 据 大 小 和 格式 以 及 性 能 方面 有 着 根 
本 的 不 同 ， 在 跨 平 台 项 目的 开发 过 程 中 ,这 些 问题 的 产生 都 是 不 可 避免 的 。 因 此 , 在 项 目 中 需要 对 
这 些 差异 中 的 部 分 代码 进行 封装 ， 以 便 在 开发 过 程 中 为 不 同 平台 的 开发 和 编译 提供 更 好 的 支持 。 


18.11.1 内 存 对 齐 

所 谓 内 存 对 齐 ， 就 是 当 处 理 器 访问 长 度 为 n 字 节 的 一 段 数据 时 ,这 段 数据 的 起 始 地 址 必须 是 n 
的 倍数 ， 例 如 一 个 4 字 节 长 的 变量 的 地 址 应 该 是 4 的 倍数 ， 一 个 2 字 节 长 的 变量 的 地 址 应 该 是 2 
的 倍数 。 但 是 处 理 器 对 于 内 存 访问 常常 有 不 同 的 要 求 , 一 旦 没 能 满足 这 些 要 求 , 将 导致 处 理 器 故障 。 
为 了 获得 最 大 的 可 移植 性 , 应 当 强制 对 齐 , 以 达到 最 高 的 可 能 粒度 , 而 不 应 该 依赖 指针 这 样 的 窃 门 ， 
因为 指针 可 能 会 引发 更 多 的 意外 。 

解决 这 个 问题 的 方法 是 ， 在 定义 相关 的 类 型 时 ， 定 义 自己 的 对 齐 系数 。 每 个 特定 平台 上 的 纺 
译 器 都 有 自己 的 默认 对 齐 系数 (也 叫 对 齐 模 数 )。 在 开发 过 程 中 , 可 以 通过 预 编 译 命令 和 ragma pack(n) 

(Cn=12,4,8,16) 来 改变 这 一 系数 ， 其 中 的 n 就 是 需要 被 指定 的 “对 齐 系数 ”。 结 构 (struct) 或 联 
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fr nion) 的 数据 成 员 中 ， 第 一 个 数据 成 员 放 在 offset 为 0 的 地 方 ， 以 后 每 个 数据 成 员 的 对 齐 按 
照 #pragma pack 指定 的 数值 和 这 个 数据 成 员 自身 长 度 中 比较 小 的 那个 进行 。 在 数据 成 员 完成 各 自 对 
齐 之 后 , 结构 (或 联合 ) 本 身 也 要 进行 对 齐 , 对 齐 将 按照 #pragma pack 指定 的 数值 和 结构 (或 联合 ) 
最 大 数据 成 员 长 度 中 比较 小 的 那个 进行 。 另 外， 当 #pragma pack 的 n 值 等 于 或 超过 所 有 数据 成 员 长 
度 的 时 候 , 这 个 n 值 的 大 小 将 不 产生 任何 效果 ， 所 以 在 编写 这 部 分 代码 的 过 程 中 必须 谨慎 , 合理 地 
规划 结构 中 每 一 个 变量 的 位 置 。 


18.11.2. 3E 5I 

所 有 多 字 节 的 变量 在 内 存 中 可 以 表示 为 两 种 形式 ， 即 大 字 节 序 (big-endian ) 和 小 字 节 序 
(little-endian)， 它 们 在 数据 类 型 中 就 展示 了 字 节 顺序 。 在 Windows 系列 的 平台 ， 中 小 字 节 序 是 其 
主要 的 存储 方式 , 除非 有 着 特殊 的 需求 ， 否 则 不 会 出 现 大 字 节 序 的 方式 。 两 者 具体 的 区 别 从 下 面 这 
个 示例 来 看 : 











union 

{ 
Long 1; // 这 里 假设 sizeof(long) == 4 
unsigned char c[4]; 

)u; 

u.l - 0x12345678; 

printf( *c[0] = Ox$xWn" , (unsigned) u.c[0]); 


在 小 字 节 序 的 机 器 上 运行 时 ， 会 看 到 如 下 输出 : 





c[0] - 0x78 
在 大 字 节 序 的 机 器 上 运行 时 ， 会 看 到 如 下 输出 : 
c[0] = 0x12 


二 者 在 内 存 中 的 存储 方式 如 表 18-3 所 示 。 
表 18-3. 内存 存储 方式 的 对 比 





这 就 造成 了 一 个 问题 ， 多 字 节 数据 不 能 被 具有 不 同 字 节 排序 的 处 理 器 直接 共享 。 例 如 ， 如 果 
将 某 些 多 字 节 数据 写 入 一 个 文件 , 然后 在 具有 不 同 字 节 序 的 体系 结构 上 读 取 这 些 数据 , 那么 数据 将 
是 混乱 的 ,为 了 使 代码 结构 更 加 清晰 ,在 项 目 进行 初始 化 的 阶段 就 需要 对 处 理 器 的 字 节 序 进 行 判定 ， 
判定 的 方法 如 下 : 


bool APT_PS_AddressDoctor5: :getEndian0 
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t 

// 判 断 当前 平台 的 字 节 顺序 

// 初 始 化 变量 

inti = 0x12345678; 

// 判 断 该 变量 第 一 个 字 节 的 内 容 从 而 确定 字 节 顺序 

if (*(char *)&i = 0x12) 
// 如 果 为 小 字 节 序 ， 则 返回 true 
return true; 

else if (*(char *) & i = 0x78) 
// 如 果 为 大 字 节 序 ， 则 返回 false 
return false; 


} 


18.11.3 ”类 型 的 大 小 


处 理 器 有 一 个 对 应 于 其 内 部 寄存 器 大 小 的 自然 尺寸 ， 代 表 变 量 的 最 佳 尺 寸 ， 长 时 间 以 来 ， 很 
多 开发 人 员 在 编写 代码 时 都 会 默认 sizeof(in) =4 的 条 件 。 然 而 ， 当 开发 环境 进入 64 位 平台 时 ， 关 
于 int 的 大 小 会 让 开发 人 员 明 显 感觉 到 这 种 认定 的 不 确定 性 。 

在 日 常 的 开发 习惯 中 ， 整 型 、 长 整 型 和 指针 的 大 小 都 是 32 位 ， 即 4 字 节 ， 这 也 是 常年 使 用 
Windows 系统 所 带 来 的 固定 思维 。 然 而 在 64 位 操作 平台 上 ， 这 样 的 长 度 将 会 变 得 不 确定 ， 一 般 整 
型 依旧 会 成 为 内 部 寄存 器 大 小 的 自然 尺寸 ， 而 长 整 型 却 有 着 不 同 的 选择 ， 可 以 与 int 的 长 度 相 同 ， 
也 有 可 能 是 int 类 型 的 两 倍 ， 这 取决 于 处 理 器 和 编译 器 对 类 型 的 定义 。 所 以 ， 在 开发 跨 平 台 应 用 程 
序 的 过 程 中 ,需要 指定 特定 的 长 度 , 在 有 必要 的 情况 下 自 定义 类 型 ， 通 过 每 个 类 型 的 大 小 范围 指定 
统一 的 变量 长 度 ， 从 而 实现 开发 的 统一 ， 而 这 部 分 的 实现 可 以 通过 C 语言 的 预 处 理 程序 〈 即 宏 定 
义 ) 来 实现 差异 的 控制 。 


18.11.4 ”使 用 预 编译 处 理 类 型 差异 


C/C++ 预 处 理 程序 在 帮助 开发 跨 平 台 软件 时 是 一 个 非常 有 效 的 工具 , 应 用 程序 在 平台 之 间 编 译 
的 过 程 中 , 这 种 预 处 理 所 提 供 的 条 件 编译 、 原 始 文本 蔡 换 以 及 预定 义 符号 可 以 极 大 地 减少 平台 间 差 
异 所 带 来 的 代码 量 。 由 于 编译 器 的 不 同 ，C++ 语 言 的 内 建 类 型 的 类 型 长 度 、 字 节 顺 序 等 可 能 会 有 着 
不 同 的 定义 ， 因 此 在 开发 过 程 中 ， 需 要 先 对 这 些 类 型 进行 预定 义 ， 以 消除 潜在 的 问题 ， 例 如 : 

// 定 义 内 建 变量 ， 以 便 需 要 改变 处 理 变 量 的 形式 时 ， 直 接 改 变 这 些 宏 定 义 即 可 ， 

// 而 不 需要 改变 程序 每 一 个 涉及 的 代码 


#if (defined (_WINDOWS)) 
//! 8 bit signed type 


typedef char AD 18; / /根据 字 节 位 数 定义 变量 名 称 
//! 16 bit signed type 

typedef short AD I16; // 定 义 16 位 变量 

//! 32 bit signed type 

typedef int AD 132; // 定 义 32 位 变量 

//! 64 bit signed type 

typedef char AD CHAR; //char 为 单字 节 变 量 
//! 8 bit type 

/* 略 去 其 他 定义 */ 
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#endif 


为 了 统一 各 个 变量 之 间 的 类 型 长 度 及 开发 标识 ， 在 该 项 目 中 使 用 了 条 件 编译 以 及 宏 来 实现 对 
内 建 类 型 的 定义 ， 然 而 宏 的 应 用 不 仅仅 在 于 此 ， 例 如 在 处 理 跨 字符 〈 双 字 节 的 类 型 字符 ) 时 ， 类 型 
的 长 度 及 范围 的 差异 也 会 使 程序 产生 异常 ， 因 此 这 类 变量 需要 被 更 加 详细 的 定义 : 


// 动 态 地 定义 变量 AD_WCHRR 

#if (WCHAR MIN = 0 && WCHAR MAX ==65535) || (WCHAR MIN---32768 ) && 
WCHAR MAX-— 32767) 

// 如 果 wchar 的 字 节 长 度 为 2 字 节 ， 则 定义 为 wchar t 

typedcf wchar t AD WCHAR; 

#elif USHRT MIN—O && USHRT MAX— 65535 

// 如 果 unsigned short 的 字 节 长 度 为 2 字 节 

typedef unsigned short AD WCHAR; 

#else 


# 和 否则 无 法 定义 该 常量 

#endif 

此 外 ， 由 于 C 语言 的 预定 义 或 者 说 宏 的 使 用 不 受 变量 或 者 函数 的 限制 ， 在 项 目 中 甚至 可 以 使 
用 宏 来 区 别 不 同 平台 间 的 关键 字 ， 比 如 Windows 下 链接 动态 库 的 时 候 需要 的 关键 字 
_declspec(dllexport)， 不 过 过 度 使 用 宏 将 会 给 处 理 器 带 来 不 可 预料 的 异常 ， 因 此 在 使 用 C 语言 的 预 
定义 时 ， 要 根据 程序 的 需要 合理 的 添加 ， 宏 的 使 用 要 尽量 以 解决 平台 间 的 差异 为 核心 ， 而 不 是 为 了 
节约 一 部 分 代码 。 





18.12 编译 器 的 差异 控制 


编译 器 的 差异 主要 体现 在 扩展 语言 范围 ， 以 支持 特定 平台 的 需要 后 ， 不 同 的 扩展 特性 不 能 被 
其 他 的 平台 所 共享 ， 最 具有 代表 性 的 就 是 windows.h 头 文件 。 在 Visual Studio C+ 中， 这 些 定义 可 
以 为 开发 人 员 提供 相当 的 便利 ,然而 这 其 中 所 定义 的 多 数 标准 即使 是 针对 控制 台 程序 的 , 也 将 无 法 
在 Linux 中 得 到 支持 。 其 次 ， 编 译 器 在 内 存 管理 方面 也 有 着 细节 上 的 区 别 ， 而 这 些 区 别 也 会 给 跨 平 
台 应 用 程序 的 软件 开发 带 来 差异 ， 因 此 在 处 理 这 部 分 的 差异 时 ， 可 以 通过 自身 实现 来 克服 ， 同 时 也 
需要 软件 项 目的 代码 设计 更 注重 平台 间 的 不 同 。 


18.12.1 实现 平台 无 关 的 代码 


以 windows.h 头 文件 为 例 , 文件 中 定义 了 编译 器 默认 的 各 种 标志 、 预 处 理 标识 以 及 编译 错误 标 
识 ， 同 时 还 通过 引入 其 他 相关 的 头 文件 定义 了 有 具有 Windows 平台 特性 的 函数 调用 ， 在 这 其 中 可 以 
找到 系统 的 接口 函数 、 网 络 接 口 (WinSock) ， 甚 至 一 些 类 型 的 操作 函数 ， 例 如 Unicode 字符 串 的 
操作 。 然 而 ， 跨 平台 项 目的 开发 并 不 能 够 以 其 中 的 某 一 个 平台 为 标准 ， 因 为 很 多 特性 在 其 他 平台 上 
是 无 法 共享 的 ， 即 使 有 类 的 实现 ， 调 用 的 方式 也 有 着 很 大 的 不 同 。 因 此 ， 在 项 目的 开发 过 程 中 需要 
制定 这 些 函 数 的 操作 实现 ， 以 扩充 自身 的 可 移植 的 代码 库 。 

首先 ， 宏 定义 对 跨 平台 项 目的 开发 有 着 很 大 的 帮助 ， 无 论 是 从 维护 还 是 代码 结构 上 ， 都 能 不 
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同 程度 地 缩减 项 目的 工作 量 , 所 以 在 开发 过 程 中 必须 针对 项 目的 需求 定义 自己 的 标识 符 。 这些 标识 
符 包括 项 目 中 用 户 操作 的 配置 、 项 目的 异常 处 理 标志 以 及 一 些 表示 该 平台 特定 的 定义 , 而 实现 的 方 
式 就 是 编写 自己 的 头 文件 来 定义 ， 例 如 


// 定 义 界面 中 的 选项 在 后 台 处 理 的 唯一 标识 





#define QSAV SOANAME "companyNname QSAV" 
#define QSAV SOA1D "listID QSAV" 

#define QSAV SOAREPORT "reportFile QSAV" 
#definc QSAV PROCESSED "RecordsProcessed QSAV" 
#define QSAV PASSED "RecordsPassed QSAV" 
/x* 略 去 其 他 相同 定义 */ 


// 定 义 异常 处 理 时 的 输出 ， 其 中 setconfig.xml 是 由 界面 传 入 后 台 的 各 个 选项 的 选择 

#define AD SC WRN INIT UNLOCKCODE CORRUPT  1//!« The SetConfig.xml contained 
atleast one corrupt unlock code 

#define AD SC WRN INIT UNLOCKCODE EXPIRED 2 //!« The SetConfig.xml contained 
atleast one expired unlock code 


这 些 定义 有 些 可 以 直接 在 项 目 中 使 用 , 而 有 些 还 需要 配合 配置 文件 来 获得 这 些 标 识 所 代表 的 实 
际 意义 , 接 下 来 将 要 做 的 是 将 这 些 预 定义 整理 在 同一 个 头 文件 中 , 并 确保 项 目 在 使 用 的 时 候 包含 这 
些 头 文件 ， 这 样 就 可 以 避免 由 于 字符 的 差别 所 引发 的 平台 下 的 差异 。 

以 字符 串 操 作为 例 ， 如果 项 目 需要 支持 多 种 语言 ， 而 像 中 文 、 韩 文 等 ，ASCII 码 无 法 给 予 其 支 
持 ， 所 以 在 进行 字符 操作 的 时 候 ， 就 需要 使 用 宽 字符 作为 主要 变量 ， 在 前 面 已 经 讨论 过 wchar 这 
样 的 多 字 节 变量 , 无 论 是 字 节 顺序 还 是 字符 的 长 度 在 不 同 的 平台 中 都 有 可 能 不 同 , 所 以 就 需要 手动 
编写 关于 宽 字符 的 处 理 。 首 先 ， 需 要 统一 制定 该 变量 的 长 度 ， 这 部 分 的 实现 由 预定 义 来 完成 ， 前 面 
已 经 出 现 过 这 部 分 的 代码 ， 代 码 中 wchar t 变量 根据 不 同 平台 下 的 长 度 范围 自 定义 成 变量 
AD_WCHAR。 随 后 需要 为 这 个 新 定义 的 变量 量 身 定做 其 操作 方式 ， 字 符 串 的 操作 方式 有 很 多 ， 这 
里 以 字符 串 转换 为 例 , 假设 这 个 双 字 节 的 字符 串 需 要 复制 一 个 单字 节 字 符 串 中 的 内 容 , 而 为 了 保证 
在 转换 过 程 中 不 损失 任何 字符 , 保证 其 在 内 存 方式 上 存储 的 正确 性 , 就 需要 自己 手动 编写 这 部 分 实 
现 的 代码 ， 实 现 的 代码 如 下 : 


void APT String::wstr2cstr<const AD WCHAR*pwstr, char*pcslr, size t len) 
{ 
// 初 始 化 临时 变量 
char *ptcmp = pcstr; 
if(pwstr!-NULL && pcstr!-NULL) 
t 
// 判 断 字符 串 的 长 度 ， 并 进行 循环 处 理 
Size t wstr len = wcslen(pwstr); 
len = (len > wstr len) ? wstr len : len ; 
while( Ien --» 0) 
t 
// 如 果 是 类 中 文 的 变量 ， 则 将 字 节 的 后 8 位 拷 入 
// 否 则 是 英文 的 变量 ， 则 直接 拷 入 
if (*pwstr»» 8) !='/0') 
*pcstrtt-*pwstr >>8 ; 
*pcstr-*pwstr, 
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pwstrtt; 
pstr+=1 


} 
// 字 符 串 的 结束 符 


*pcstr- /0^; 
) 


从 代码 中 可 以 看 到 ， 这 个 过 程 的 实现 基于 APT String 类 ， 而 在 实际 项 目的 开发 过 程 中 ， 
APT String 是 在 项 目 中 手动 封装 的 一 个 类 ， 它 的 主要 目的 就 是 实现 各 个 字符 串 相 关 的 操作 。 在 实 
际 的 项 目 中 ， 需 要 被 封装 的 类 还 包括 文件 操作 、 类 型 转换 等 多 方面 的 内 容 ， 这 部 分 的 实现 要 基于 项 
目 开发 的 需求 以 及 对 不 同 平台 的 支持 。 在 多 元 化 开发 的 过 程 中 ， 这 套 被 封装 的 代码 库 是 实现 C++ 
语言 项 目 可 移植 性 的 主要 基础 , 而 在 其 设计 过 程 中 也 会 以 一 种 高 度 可 移植 的 风格 来 解决 各 个 平台 间 
的 差异 性 问题 。 


18.12.2 ”内 存 管理 

C++ 语言 没有 内 存 回收 器 ， 其 内 存 的 管理 完全 需要 开发 人 员 手 动 进行 , 这样 的 管理 方式 无 形 之 
中 增加 了 代码 的 复杂 度 。 同 时 ， 不 同 的 编译 器 在 堆 和 栈 两 方面 使 用 不 同 的 方法 表示 与 管理 内 存 。 对 
于 C++ 语言 而 言 ， 内 存 的 管理 本 身 就 容易 引发 多 种 程序 漏洞 ， 而 在 多 元 平台 下 ， 这 种 错误 更 容易 
出 现在 程序 的 各 个 角落 , 而 常见 的 内 存 错误 是 对 于 未 分 配 或 者 已 经 回收 内 存 的 变量 进行 使 用 以 及 内 
存 浇 出 的 问题 ， 在 这 里 要 适当 用 free 和 delete 及 时 对 内 存 及 变量 进行 回收 ,同时 还 要 注意 , 不 同 的 
平台 下 对 于 堆栈 的 大 小 限制 是 有 所 不 同 的 , 而 在 大 规模 的 申请 之 前 , 一定 要 做 好 检测 工作 ,还 要 配 
合 日 志 管 理 的 使 用 才能 避免 内 存 管理 问题 而 导致 的 程序 崩溃 。 


18.12.3 ”容错 性 的 影响 

采用 C/C++ 开发 程序 时 ， 缓 冲 区 溢出 的 错误 非常 普遍 ， 但 是 系统 运行 程序 的 时 候 ， 对 待 运行 
期 间 出 现 的 这 些 错误 的 处 理 能 力 是 不 同 的 。 总 的 来 说 ，Windows 系统 的 容错 性 最 强 , 尤其 是 Debug 
版 的 程序 ， 系 统 都 加 入 了 一 些 保护 机 制 ， 能 够 保证 出 现 一 些小 的 错误 以 后 ， 程 序 仍 能 够 正常 运行 。 
UNIX 平台 的 要 求 就 严格 一 些 ， 有 些 系统 更 是 容 不 得 一 点 错误 ， 有 一 点 错误 就 会 出 现 宕 机 的 现象 ， 
这 些 跟 操作 系统 的 内 存 分 配 机 制 有 关 。Windows 平台 的 程序 分 配 内 存 的 时 候 ， 一 般 都 会 多 分 出 一 
些 字 节 用 于 对 齐 ， 如 果 缓 冲 区 溢出 的 不 是 太 多 ， 就 不 会 对 内 存 中 其 他 变量 的 值 造 成 影响 ,因此 程序 
也 能 够 正常 运行 。 但 是 这 种 保护 机 制 会 带 来 更 多 的 系统 开销 。 这 就 是 Windows 程序 移植 到 UNIX 
下 稳定 性 降低 的 主要 原因 之 一 ， 也 是 Windows 系统 会 消耗 那么 多 系统 资源 的 原因 。 

要 解决 这 类 问题 ， 就 要 进行 更 严格 的 测试 和 代码 检查 。 同 时 ， 借 助 相关 的 测试 工具 找 出 系统 
中 隐藏 的 问题 ， 不 能 放 过 任何 一 个 可 能 产生 的 错误 ， 尤 其 是 在 编译 过 程 中 发 现 的 警告 信息 。 当 然 ， 
这 些 工 作 都 应 该 在 移植 前 做 得 很 充分 ， 在 移植 后 更 应 该 加 大 测试 的 力度 。 


18.42.4 ”利用 日 志 管 理 异 常 


在 处 理 各 个 编译 器 差异 的 过 程 中 ， 日 志 管理 的 合理 使 用 发 挥 着 重要 的 作用 ， 一 方面 它 可 以 为 最 终 
的 用 户 提供 应 用 程序 的 运行 状态 ， 另 一 方面 ， 在 开发 阶段 它 可 以 提供 更 加 准确 的 异常 捕捉 的 范围 。 
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在 移植 的 过 程 中 潜在 的 异常 或 错误 会 时 常 出 现 ， 同 时 ， 像 ty、catch 这 样 的 机 制 并 不 能 够 涵盖 
全 部 代码 ， 更 确切 地 说 ， 过 分 地 使 用 try» catch 机 制 会 直接 影响 代码 运行 的 效率 。 因 此 ， 利 用 日 志 
来 定位 程序 运行 的 阶段 以 及 异常 的 多 发 区 控制 是 更 合理 的 办 法 。 

日 志 管理 的 实现 有 很 多 种 形式 ， 例 如 ， 在 缓冲 区 中 直接 读 写 ， 或 者 借助 于 配置 文件 进行 读 写 ， 
前 者 实现 日 志 的 读 写 效率 更 高 ， 但 是 会 占用 内 存 ， 而 后 者 则 会 使 程序 的 效率 降低 。 而 开发 一 个 软件 
产品 ,不仅 在 日 志 管理 中 涉及 文件 的 读 写 ， 其 本 身 就 需要 进行 文件 的 输入 输出 。 因此， 最 佳 的 方式 
是 利用 配置 文件 进行 读 写 ,， 并 同时 为 其 在 程序 内 部 配置 一 个 开关 ， 若 打开 开关 ， 则 会 进行 日 志 的 读 
写 ， 否 则 不 会 。 在 代码 中 的 实现 如 下 











IF DEBUG(validateop){ 
APT MSG (Info, "DSEE-QSAV-00071", args. 0); 
) 


IF DEBUG 则 控制 程序 内 部 的 开关 是 否 输出 口 志 ， 其 实现 如 下 


#define IF DEBUG(module )\ 
if (APT debug.isDebugModuleOn(APT ##module_)) 


其 中 的 APT. debug 为 全 局 变量 ， 对 象 内 部 存储 的 标志 表示 该 应 用 程序 运行 过 程 中 的 每 一 个 阶 
段 ， 而 在 本 阶段 是 否 要 输出 日 志 ， 则 由 项 目 刚 刚 开 始 时 配置 的 参数 决定 。 该 项 目 还 为 各 个 阶段 的 输 
出 做 了 文件 映射 ,代码 中 DSEE-QSAV-00071 这 一 标志 则 表示 在 QSAV 文件 中 对 应 的 第 71 条 信息 ， 
文件 映射 部 分 则 由 map 模板 来 实现 。 在 QSAV 文件 中 ， 信 息 的 定义 如 下 

/7 和 省略 其 他 类 似 定义 

QSRAV0070 "validation Result list:" 

QSAVO071 "Preload Country Successful! Wn" 


QSAV0072 "Preload Country Failed: {0}\n" 
QSAV0073 "Country Invalid for preloading: {0}\n" 


如 果 在 该 程序 运行 时 ， 为 其 配置 了 参数 validateop， 则 将 会 在 日 志文 件 中 看 到 如 下 信息 : 
Preload Country Successful! 


在 该 程序 中 , 这 部 分 代码 主要 用 于 检测 内 存 是 否 出 现 溢出 , 这 部 分 代码 内 容 涉 及 读 取 一 个 大 容 
量 的 比 对 文件 进入 内 存 中 ,而 不 同 的 平台 对 于 内 存 的 使 用 有 着 不 同 的 限制 , 当 内 存 出 现 异 常 或 不 足 
的 情况 时 ,程序 会 停止 写 入 ,这 样 则 会 导致 运行 以 后 的 结果 不 准确 。 因 此 ,在 运行 之 后 得 到 异常 的 
结果 时 ， 可 以 配合 日 志 中 的 输出 来 判定 是 不 是 因为 程序 的 错误 而 导致 这 样 的 情况 发 生 。 


18.13 ”操作 系统 和 接口 库 


不 同 的 操作 系统 中 都 存在 一 些 系 统 的 限制 ， 如 打开 文件 句柄 数 的 限制 、Socket 等 待 队 列 的 限 
制 、 进 程 和 线程 堆栈 大 小 的 限制 等 ， 因 此 在 开发 的 过 程 中 ， 必 须 考 虑 这 些 限 制 因 素 对 程序 的 影响 。 
当然 ， 有 些 限制 参数 可 以 适当 地 调整 ， 这 就 需要 在 发 布 程序 的 时 候 加 以 声明 。 
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18.13.1 文件 描述 符 的 限制 


文件 描述 符 最 初 是 UNIX 下 的 一 个 概念 ， 在 UNIX 系统 中 ， 用 文件 描述 符 来 表示 文件 、 打 开 
的 Socket 连接 等 ， 跟 Windows 下 HANDLE 的 概念 类 似 。 文 件 描述 符 是 一 种 系统 资源 ， 系 统 对 每 
个 进程 可 以 分 配 的 文件 描述 符 数量 都 有 限制 。 以 Solaris 为 例 ， 默 认 情况 下 每 个 进程 可 以 打开 的 文 
件 描述 符 为 1024 个 ,系统 的 硬 限制 是 8192 个 (具体 的 值 跟 版 本 有 关 ) ,也 就 是 说 可 以 调整 到 8192 
个 。 TE UNIX 系统 下 ,使 用 ulimit 命令 来 获得 系统 的 这 些 限制 参数 。 一 般 情况 下 都 是 够 用 的 , 但 是 
有 一 个 例外 ， 在 32 位 的 Solaris 程序 中 ， 使 用 标准 输入 输出 函数 〈stdio) 进行 文件 的 操作 ， 文 件 描 
述 符 最 多 不 能 超过 256 个 。 比 如 用 fopen 打开 文件 ， 除 法 系统 占用 的 3 个 文件 描述 符 (stdin、stdout 
和 stderr) 外 ， 程 序 中 只 能 再 同时 打开 253 个 文件 。 如 果 使 用 open 函数 来 打开 文件 ， 就 没有 这 个 限 
制 ， 但 是 就 不 能 使 用 stdio 中 的 那些 函数 进行 操作 了 ， 使 程序 的 通用 性 和 灵活 性 有 所 降低 。 这 是 因 
为 在 stdio 的 FILE 结构 中 ， 用 一 个 unsigned char 来 表示 文件 描述 符 ， 所 以 只 能 表示 0 一 255。 

在 网 络 程序 的 开发 中 , 每 一 个 网 络 连接 也 都 占用 一 个 文件 描述 符 , 如 果 程序 打开 了 很 多 Socket 
连接 〈 典 型 的 例子 就 是 使 用 连接 池 技 术 ) ， 那 么 程序 运行 的 时 候 可 能 用 fopen 打 不 开 文 件 。 

解决 这 个 问题 可 以 采用 以 下 几 种 方法 : 


€ ”升级 为 64 位 系统 或 采用 64 位 方式 编译 程序 。 

€ 使 用 sys/io.h 中 的 函数 操作 文件 。 

@ 采用 文件 池 技 术 ， 预 留 一 部 分 文件 描述 符 (3 一 255 的 ) ， 使 用 freopen 函数 来 重用 这 
些 描 述 符 。 


至 于 采用 哪 种 方法 或 者 是 否 考虑 在 系统 中 处 理 这 个 问题 , 就 要 视 具体 的 情况 而 定 了 , 那些 不 受 
这 个 限制 影响 的 程序 可 以 不 考虑 这 个 问题 。 


18.13.2 ”进程 和 线程 的 限制 


一 般 的 操作 系统 对 每 个 进程 和 线程 可 以 使 用 的 资源 数 都 有 限制 ， 比 如 一 个 进程 可 以 创建 的 线 
程 数 、 一 个 进程 可 以 打开 的 文件 描述 符 的 数量 、 进 程 和 线程 栈 大 小 的 限制 和 默认 值 等 。 

针对 这 些 问题 ， 首 先 要 分 析 和 考虑 所 开发 的 系统 的 规模 ， 会 不 会 受到 这 些 限制 的 影响 ， 如 果 
需求 大 于 系统 的 限制 ， 可 以 通过 适当 地 调整 系统 参数 来 解决 ， 如 果 还 不 能 解决 ， 就 得 考虑 采用 多 进 
程 的 方式 来 解决 。 对 于 进程 和 线程 的 栈 空间 大 小 的 限制 , 主要 是 解决 线程 栈 空间 的 问题 。 一 般 的 系 
统 都 有 默认 的 线程 栈 空间 大 小 , 而 且 不 同 操作 系统 的 默认 值 可 能 不 同 。 在 通常 情况 下 ,这 些 对 程序 
没有 影响 , 但 是 当 程序 的 层次 结构 比较 复杂 , 使 用 了 过 多 的 本 地 变量 时 ,这 个 限制 可 能 就 会 对 程序 
产生 影响 ， 导 致 栈 空间 溢出 ， 这 是 一 个 比较 严重 的 问题 。 不 能 通过 调整 系统 参数 来 解决 这 个 问题 ， 
但 是 可 以 通过 相应 的 函数 在 程序 里 面 指定 创建 线程 的 栈 空间 的 大 小 。 但 是 具体 该 调整 的 数值 适当 即 
可 ， 而 不 是 越 大 越 好 。 因 为 线程 的 栈 空间 过 大 的 时 候 ， 就 会 影响 可 创建 的 线程 的 数量 ， 虽 然 远 没有 
达到 系统 多 线程 数 的 限制 ， 但 却 可 能 因为 系统 资源 占用 过 多 导致 分 配 内 存 失败 。 


18.13.3 ”操作 系统 抽象 层 
操作 系统 函数 永远 不 要 被 直接 调用 ， 应 将 其 包装 到 一 个 “操作 系统 抽象 层 ” 的 库 中 ， 把 应 用 
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程序 从 底层 的 操作 系统 中 脱离 出 来 。 于 是 ， 当 将 应 用 程序 移植 到 其 他 操作 系统 时 ， 只 要 简单 地 移植 
操作 系统 抽象 层 即 可 , 无 须 修改 应 用 程序 的 代码 。 这 不 仅 将 原 应 用 程序 的 正确 性 和 可 靠 性 带 到 了 新 
平台 上 , 还 加 速 了 移植 过 程 。 此 外 ， 当 在 向 新 平台 移植 的 过 程 中 发 现 错误 时 ， 操 作 系统 抽象 层 将 是 
调试 的 最 有 效 的 起 点 。 

操作 系统 抽象 层 应 该 输出 函数 原型 ， 同 时 ， 无 论 底层 的 操作 系统 是 如 何 实现 的 ， 抽 象 层 应 该 
对 应 用 程序 隐藏 它 的 一 些 特殊 行为 。 例 如， 以 对 信号 量 的 操作 为 例 ， 在 大 多 数 操作 系统 中 ,相同 的 
进程 可 以 多 次 获取 一 个 信号 量 , 而 某 些 操作 系统 在 递归 获取 信号 时 会 阻塞 调用 者 。 在 递归 获取 信号 
量 这 个 例子 中 , 开发 者 必须 实现 递归 行为 本 身 。 具 体 实现 时 , 一 些 操作 系统 可 能 要 比较 两 个 任务 的 
ID， 这 两 个 任务 一 个 是 上 次 要 求 获取 信号 量 的 任务 ， 另 一 个 是 本 次 要 求 获取 信号 量 的 任务 。 如 果 
两 个 ID 相同 ， 说 明 是 在 同一 进程 中 ， 函 数 将 增加 信号 量 计 数 器 的 值 ， 且 不 调用 操作 系统 的 信号 量 
获取 函数 。 相 应 地 ， 信 号 量 释放 函数 必须 对 信号 量 的 计数 器 进行 递减 操作 ， 直 到 计数 器 的 值 为 0， 
才 调 用 操作 系统 的 信号 量 释放 函数 释放 信号 量 。 

程序 中 编写 的 函数 封装 应 该 保证 在 所 有 的 操作 系统 中 具有 相同 的 行为 ， 这 可 以 避免 底层 操作 
系统 的 特殊 性 对 应 用 程序 的 影响 。Socket 库 函 数 中 的 select0 提 供 了 一 个 很 好 的 例子 来 说 明 函 数 圭 
装 的 重要 性 。 对 于 不 同 的 操作 系统 来 说 , 可 选择 的 设备 有 相当 大 的 差异 , 一 些 系统 只 允许 选择 插口 ， 
而 其 他 系统 可 以 选择 插口 、 管 道 和 消息 队列 。 在 移植 的 过 程 中 ,对 底层 操作 系统 实现 的 抽象 使 应 用 
程序 免 于 不 必要 的 、 杂 乱 的 修改 。 假 设 某 个 操作 系统 没有 实现 sdect0 中 的 超时 功能 ， 只 要 在 抽象 层 
库 中 就 能 够 完成 修改 。 否则 , 就 需要 对 应 用 程序 的 结构 进行 重大 修改 。 系 统 抽 象 层 的 具体 实现 方法 
是 利用 工厂 模式 , 抽象 出 一 个 基 类 , 然后 在 每 个 平台 下 实现 一 个 派生 类 ,根据 应 用 程序 的 具体 需要 
实例 化 不 同 的 派生 类 。 


18.14 ”用 户 界 面 


在 跨 平台 软件 的 开发 过 程 中 ， 用 户 界面 的 开发 是 最 为 复杂 的 ， 因 为 几乎 每 一 个 平台 下 用 于 图 
形 开发 的 GUI 工具 包 都 有 所 不 同 ， 而 且 互 相 不 支持 。 因 此 ， 在 实际 的 开发 过 程 中 ， 往 往 需要 第 三 
方 工具 包 的 支持 ， 而 在 目前 流行 的 图 形 界面 包 中 ，wxWidgets 提供 了 绝 佳 的 选择 ， 虽 然 目前 支持 
C++ 语言 的 跨 平台 图 形 开发 工具 有 很 多 ， 例 如 Qt、MFC 等 ， 但 是 使 用 wxWidgets 不 仅 是 从 开源 的 
角度 , 其 也 给 跨 平台 的 软件 开发 提供 了 很 多 其 他 方面 的 支持 。 但 是 使 用 第 三 方 库 进行 图 形 界面 开发 
之 前 , 需要 分 离 所 开发 项 目的 基础 逻辑 部 分 和 图 形 部 分 的 代码 , 这 样 一 方面 可 以 使 原来 所 开发 的 代 
码 保持 很 好 的 独立 性 ， 另 一 方面 也 为 图 形 方 面 的 可 移植 莫 定 了 基础 。 


18.141 ” 跨 平 台 软 件 图 形 界面 的 设计 
每 一 个 带 有 图 形 界面 的 程序 都 由 两 个 主要 部 分 组 成 : 


(1) 构成 程序 基础 的 逻辑 代码 和 数据 。 
D 允许 用 户 操作 查看 由 程序 部 分 管理 的 数据 的 UI。 


通常 一 个 C/S 架构 的 应 用 程序 必然 会 将 逻辑 部 分 和 用 户 操作 部 分 分 开 ， 前 者 称 为 Server 端 ， 
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后 者 称 为 Client 端 ， 这 种 架构 的 好 处 不 仅 是 根据 项 目 应 用 于 网 络 或 者 安全 性 质 的 考虑 而 不 得 不 分 
开 , 同时 可 以 很 大 程度 地 提高 项 目的 健壮 性 以 及 可 修改 性 。 而 在 跨 平 台 的 项 目 中 ,类 似 这 种 架构 将 
得 到 更 为 广泛 的 使 用 , 因为 开发 人 员 不 可 能 在 已 经 开发 好 的 逻辑 中 添加 图 形 界 面 的 代码 , 这 些 代码 
往往 并 不 具有 可 移植 性 ,可 以 想象 在 其 中 加 入 大 量 的 条 件 语 句 之 后 , 代码 将 会 变 得 多 么 的 不 可 维护 。 
如 果 将 其 单独 地 拿 出 来 , 就 可 以 在 其 中 设计 图 形 界面 方面 自己 的 架构 , 添加 设计 模式 的 思想 , 使 其 
中 的 代码 更 加 便于 维护 。 此 外 ， 考 虑 到 GUI 应 用 程序 的 特殊 性 ， 当 用 户 的 界面 创建 和 显示 以 后 ， 
它们 都 会 要 求 程序 进入 一 个 时 间 循 环 。 这 个 循环 体 把 事件 处 理 部 分 分 配给 指定 的 代码 来 创建 和 实现 
更 多 的 用 户 界面 。 这 就 要 求 开发 人 员 单 独 地 编写 用 户 交 互 部 分 的 代码 , 而 这 些 也 需要 以 图 形 界面 的 
控件 为 中 心 。 





18.14.2 wxWidgets 简介 


wxWidgets 是 一 个 跨 平台 的 软件 开发 包 。 它 诞生 于 1992 年 ， 最 初 的 名 字 是 wxWindows, 但 由 
于 Microsoft 的 抗议 ， 在 2004 年 改名 为 wxWidgets。 它 最 初 被 设计 成 跨 平 台 的 GUI 软件 开发 包 ， 
但 后 来 随 着 越 来 越 多 的 人 参与 进来 ， 为 wxWidgets 加 入 了 许多 非 GUI 的 功能 ， 如 多 线程 
Cmultithread) 、 网 络 (network) 等 。 并 且 从 最 初 的 只 支持 C++ 语言 逐渐 发 展 成 为 支持 多 种 语言 ， 
如 Python、Perl、C#、Basic 等 。 因 此 ， 现 在 的 wxWidgets 已 经 不 再 是 单纯 的 跨 平台 的 GUI 软件 开 
发 包 , 而 是 一 个 可 以 支持 多 种 操作 系统 平台 的 能 够 在 多 种 语言 中 使 用 的 通用 跨 平台 软件 开发 包 。 由 
于 wxWidgets 最 开始 是 为 C++ 而 设计 的 ， 因 此 对 C++ 语言 有 着 更 好 的 支持 。 


18.14.3 ”使 用 wxWidgets 开发 跨 平台 软件 的 界面 


wxWidgets 作为 一 个 跨 平 台 的 开发 工具 包 ， 在 使 用 其 作为 GUI 的 开发 工具 以 后 ， 使 得 跨 平台 
的 应 用 程序 在 图 形 方 面 的 开发 更 专注 于 其 自身 的 代码 编写 。 因 为 wxWidgets 本 身 对 Windows、 
UNIX、Linux 系列 下 的 各 个 平台 都 有 着 很 好 的 支持 ， 与 此 同时 ， 它 的 底层 代码 也 是 通过 C++ 语言 
来 实现 的 ， 所 以 利用 这 个 工具 来 开发 一 个 利用 C++ 语言 实现 跨 平 台 应 用 程序 的 用 户 界面 可 以 说 是 
再 合适 不 过 了 。 而 最 关键 的 是 ，wxWidgets 对 于 偏好 Windows 的 开发 人 员 来 说 上 手 很 快 ， 下 面 的 
例子 将 会 说 明 这 个 问题 。 

抽象 地 说 ,一 个 UI 应 用 的 创建 过 程 是 这 样 的 。 首 先 创建 一 个 wxFrame 实例 ， 并 制定 长 宽 和 屏 
幕 上 的 位 置 。 接 着 创建 垂直 sizer widget 和 顶层 窗口 的 子 sizer。 然 后 创建 一 个 垂直 sizer widget 和 一 
个 水 平子 sizer。 最 后 创建 wxStaticText 实例 并 为 这 个 窗口 应 用 添加 事件 响应 。 代 码 示例 如 下 : 

class my frame : public wxframe // 窗 体 类 

{ 

Public: 

myframe(const wxstring& title); // 窗 体 的 构造 函数 

h 

myframe::myframe(const wxstring& title): wxframe(null, wxid any, title) 

wxmenu *filemenu = new wxmenu; // 建立 “文件 ”菜单 

wxmenu *helpmenu = new wxmenu; // 建立 “帮助 ”菜单 

helpmenu-»append(wxid about, t("XF"tfl"), 七 (显示 关于 对 话 框 ") ) ; 

filemenu-»append(wxid exit， 七 (" 退 出 "talt-x”) ， 七 (" 退 出 应 用 程序 ") ) ; 

wxmenubar *menubar = new wxmenubar(); // 建立 一 个 菜单 条 
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menubar-»append(filemenu, 七 (" 文 件 ”) ); // 将 “文件 ”菜单 加 入 菜单 条 
menubai »append(helpmenu, tt ("帮助")); // 将 “帮助 ”菜单 加 入 菜单 条 
setmenubar (menubar) ; // 将 菜单 条 放 到 窗 体 上 

} 


在 完成 这 个 窗口 之 后 ， 还 需要 实现 下 面 的 类 : 





class MyApp: public wxtApp 
{ 
public: 
virtual bool Onlnit0; 
) 
bool MyApp:: Onlnit 0 
t 
// 建 立 myframe 类 的 实例 
myframe *frame-new myframc( t ("wxwidgets 程 序 ”)); 
frame-»show(true); // 显 示 主 窗 体 
return true; // 必 须 返 回 true， 和 否则 应 用 程序 将 退出 
) 


无 论 是 窗口 类 之 间 的 继承 关系 还 是 其 中 实现 控件 的 代码 ，wxWidgets 深 受 MFC 的 影响 。 下 面 
这 个 规则 表明 就 像 一 个 跨 平 台 的 MFC: 在 创建 完成 wxWidgets 窗口 以 后 ， 还 需要 用 
IMPLEMENT APP 宏 来 向 wxWidgets 注册 从 wxApp 继承 而 来 的 类 ; 


IMPLEMENT (MyApp) 


在 实际 开发 过 程 中 , 这 部 分 的 开发 更 注重 如 何 编写 图 形 界面 ， 而 跨 平 台 软 件 的 开发 部 分 则 集中 
在 与 逻辑 代码 部 分 的 通信 中 ， 通 信 部 分 的 实现 会 根据 项 目的 具体 情况 而 定 ， 对 于 网 络 部 分 的 程序 ， 
通信 通过 Socket 来 实现 是 再 好 不 过 的 方法 ， 而 同时 这 套 类 库 可 以 支持 多 个 平台 ,移植 性 非常 好 ， 
唯一 需要 注意 的 就 是 网 络 通信 过 程 中 的 数据 顺序 、 缓冲 区 等 问题 。 而 对 于 非 网 络 应 用 ,笔者 更 倾向 
于 使 用 XML 文件 ， 一 方面 XML 格式 被 多 个 平台 所 支持 ， 另 一 方面 其 自身 规范 的 格式 也 为 跨 平 台 
的 软件 开发 提供 了 严谨 的 数据 格式 。 


第 19 章 Linux 下 的 安全 编程 


19.1 本 章 概述 


随 着 信息 技术 的 飞速 发 展 ， 网 络 安全 理论 得 到 了 广泛 的 应 用 。 身 份 认证 是 网 络 安全 的 第 一 道 
屏障 。 实 现 身 份 认证 的 方法 很 多 ， 但 传统 的 、 单 一 的 认证 手段 暴露 出 了 严重 的 安全 隐患 ， 已 经 不 能 
适应 信息 技术 高 速 发 展 的 要 求 ， 因 此 迫切 需要 一 种 更 为 安全 高 效 的 认证 方式 。 

PKI 以 公 钥 密码 学 为 基础 ， 能 保证 信息 的 机 密 性 、 完 整 性 与 不 可 否认 性 。CA 是 PKI 的 核心 组 
成 部 分 ， 它 把 用 户 的 公 钥 及 其 他 标识 信息 捆绑 在 一 起 ， 为 用 户 签发 和 管理 数字 证 书 。PKI 作为 当前 
网 络 安全 认证 领域 中 的 最 佳 技术 ， 已 经 被 广泛 应 用 于 电子 商务 活动 中 。 

本 章 运 用 PKI 技术 设计 并 实现 一 个 小 型 的 数字 认证 系统 。 首 先 ， 介 绍 相关 的 项 目 背景 知识 ， 
比如 密码 学 基础 理论 与 身份 认证 方式 ， 并 详细 阐述 PKI 的 相关 技术 ; 其 次 ， 通 过 分 析 项 目 具 体 功 
能 需求 设计 一 个 简单 的 小 型 数字 认证 系统 ; 最 后 , 实现 该 小 型 数字 认证 系统 。 该 系统 实现 了 证 书生 
成 、 证 书 撤销 、 证 书 更 新 、 密 钥 管理 等 功能 。 此 外 ， 针 对 信息 传输 过 程 中 存在 的 信息 窃听 问题 ， 我 
们 借助 网 络 安全 协议 SSL 实现 了 数据 的 加 密 传输 ， 建 立 了 数据 传输 的 安全 通道 ， 实 现 了 基于 数字 
证 书 的 身份 认证 。 

网 络 技术 的 兴起 和 应 用 给 和 人们 的 生活 和 工作 带 来 了 重大 变化 ， 信 息 技术 正在 不 断 深入 社会 的 
各 个 层面 ， 并 在 国防 、 生 产 、 生 活 等 领域 产生 着 深刻 的 影响 。 现 在 无 论 是 政府 机 构 还 是 企 事业 单位 
的 传统 事务 都 向 自动 化 、 数 字 化 和 网 络 化 转变 。 人 们 通过 各 种 通信 网 络 进行 数据 的 传输 、 交 换 、 存 
储 、 共 享 和 分 布 式 计算 。 可 见 ， 计 算 机 信息 技术 的 高 速 发 展 给 世界 带 来 了 巨大 的 变化 ， 推 动 了 一 次 
又 一 次 科技 革命 的 到 来 。 但 是 ， 信 息 技术 给 我 们 带 来 方便 与 快捷 的 同时 ， 也 带 来 了 许多 安全 隐患 。 
在 信息 传输 和 交换 时 , 首要 的 工作 就 是 需要 对 交互 双方 的 身份 进行 合法 认证 , 还 要 对 通信 信道 上 传 
输 的 机 密 数据 进行 加 密 ; 在 数据 存储 和 共享 时 ， 需 要 对 数据 进行 安全 的 访问 控制 ; 在 进行 多 方 计算 
时 ， 需 要 保证 各 方 机 密 信息 不 被 泄露 。 这 些 都 属于 网 络 安全 领域 所 要 面 对 的 难题 。 

随 着 计算 机 网 络 和 各 种 通信 网 络 的 快速 发 展 ， 网 络 安全 问题 日 益 突出 。 如 何 解决 网 络 安全 的 
问题 是 信息 化 社会 必须 面临 的 一 个 重要 课题 。 我 们 面临 的 网 络 安全 威胁 多 种 多 样 ， 信 息 泄露 、 完 整 
性 破坏 、 拒绝 服务 、 非 法 使 用 网 络 资源 是 4 种 基本 的 安全 威胁 , 攻击 者 可 以 采取 不 同类 型 的 主动 攻 
击 和 被 动 攻击 手段 来 达到 其 目的 。 为 了 从 系统 的 角度 研究 网 络 安 全 问题 ， 国 际 标准 化 组 织 (ISO) 
提出 了 开放 系统 互联 的 安全 体系 结构 ， 国 际 电 信 联 盟 (ITU-T) 也 从 身份 认证 、 访 问 控制 、 数 据 保 
密 性 、 数 据 完整 性 、 不 可 否认 等 安全 服务 上 定义 了 相关 标准 , 提出 了 实现 安全 服务 所 需 的 安全 机 制 。 
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身份 认证 技术 作为 网 络 安全 的 第 一 道门 槛 ， 是 最 基本 的 安全 服务 ， 其 他 的 安全 服务 都 要 依赖 于 它 。 
身份 认证 技术 已 经 成 为 网 络 安全 的 一 个 重要 课题 ， 它 对 网 络 应 用 的 安全 性 起 着 至 关 重 要 的 作用 。 

目前 ， 单 一 口令 方式 的 身份 认证 早已 被 业界 公认 不 能 有 效 保护 网 络 及 计算 机 的 账号 和 信息 资 
产 的 安全 。 现在 很 多 计算 机 网 络 应 用 系统 使 用 的 认证 方法 都 是 最 简单 的 用 户 ID+ 密 码 的 形式 。 进入 
系统 时 ,用 户 输入 用 户 名 和 口令 , 系统 根据 预存 的 用 户 信 息 与 当前 的 用 户 输入 进行 比较 ， 从 而 判断 
用 户 身份 的 合法 性 。 这 种 身份 认证 方法 很 不 安全 , 用 户 信息 一 旦 被 他 人 非法 获得 ， 极 易 受 攻击 。 目 
前 电子 商务 中 采用 的 最 为 普遍 的 方法 是 通过 一 个 证 书 授权 机 构 (Certificate Authority, CA) 发 放 数 
字 证 书 , 在 之 后 的 交易 活动 中 ， 双 方 依据 数字 证 书 来 确认 对 方 身份 。 一 个 实体 在 电子 商务 交易 活动 
中 身份 的 证 明 具 有 唯一 性 。 在 基于 数字 证 书 的 安全 通信 中 , 数字 证 书 是 证 明 用 户 合法 身份 和 提供 合 
法 公 钥 的 凭证 《有 点 类 似 每 个 人 的 身份 证 ) 。 公 钥 基 础 设施 (Public Key Infrastructure, PKI) 是 国 
际 上 解决 开放 式 互 联网 络 信息 安全 需求 的 一 套 体系 。PKI 体系 支持 身份 认证 、 信 息 传输 、 存 储 的 完 
整 性 与 机 密 性 以 及 操作 的 不 可 否认 性 。 

基于 数字 证 书 的 认证 方式 具有 很 重要 的 意义 。 首 先 ， 在 认证 过 程 中 不 涉及 秘密 信息 的 传输 ， 
用 户 可 以 向 远 端 服务 器 认证 自己 的 身份 ， 而 不 必 担 心 被 窃听 。 其 次 , 用 户 和 服务 器 之 间 不 需要 共享 
任何 密 钥 ， 因 此 它 支 持 向 多 个 服务 器 进行 认证 。 再 次 ， 这 种 认证 方式 同时 支持 双向 认证 ， 用 户 在 向 
服务 器 进行 身份 认证 的 同时 ,服务 器 端 也 可 以 利用 相同 的 机 制 进行 身份 认证 。 因此 ,基于 数字 证 书 
的 认证 方式 在 现实 中 应 用 得 极为 广泛 。 

PKI 技术 经 过 20 年 的 发 展 已 日 趋 成 熟 ， 逐 步 得 到 许多 国家 的 政府 和 企业 的 广泛 重视 ， 由 理论 
研究 进入 商业 化 应 用 阶段 。 美国、 加 拿 大 、 欧 盟 等 国家 相继 建立 了 自己 的 PKI 体系 ， 在 金融 和 通 
售 行 业 得 到 了 普及 。 这 些 国 家 开展 的 PKI 服务 都 是 由 政府 支持 和 授权 的 ， 由 政府 部 门 实行 统一 的 
审核 管理 , 组 织 制定 和 发 布 电子 交易 法 令 法 规 和 认证 中 心 认 证 管理 办 法 , 采用 有 关 国 际 组 织 发 布 的 
技术 和 操作 标准 与 协议 ， 这 些 做 法 为 规范 、 安 全 、 有 效 地 运作 PKI/CA 奠定 了 可 靠 的 基础 ， 促 进 了 
整个 PKI 行业 的 飞速 发 展 。 在 亚洲 ， 韩 国 是 开发 PKI 技术 较 早 且 体 系 相对 完善 的 国家 。 韩 国 的 认 
证 架构 有 3 个 等 级 : 最 上 一 级 是 信息 通信 部 ， 中 间 是 由 信息 通信 部 设立 的 国家 CA 认证 中 心 ， 最 下 
一 级 是 由 信息 通信 部 指定 的 下 级 授权 认证 机 构 。 在 1999 年 ， 韩 国 成 立 了 国际 CA 认证 中 心 。 日 本 
的 PKI 管理 架构 也 同样 很 有 特色 ， 它 把 PKI 应 用 体系 分 为 公众 和 私人 两 大 领域 ， 其 中 又 进行 了 若 
干 详细 的 划分 。 这 些 国 家 相继 通过 了 “电子 (数字 ) 签名 法 ”等 PKI 相关 法 律 ， 在 法 律 上 赋予 了 
数字 签名 与 传统 手工 签名 同等 的 地 位 , 极 大 地 推动 了 PKI 技术 的 应 用 。PKI 技术 发 展 的 市 场 前 景 极 
为 广阔 ，PKI 的 产品 与 服务 不 断 更 新 ， 国 际 上 有 实力 的 企业 也 纷纷 投入 这 个 行业 中 ， 例 如 全 球 最 大 
的 3 家 PKI 产 品 与 服务 提供 商 〈VeriSign、Entrust Technologies 和 Baltimore Technologies) 的 加 入 
为 这 个 行业 的 发 展 起 到 了 极 大 的 作用 。 

我 国 的 PKI 应 用 起 步 较 晚 ， 在 基础 理论 等 方面 还 依赖 于 国外 的 先进 技术 ， 虽 然 如 此 ， 近 些 年 
来 我 国 PKI 行业 的 发 展 还 是 十 分 迅速 的 。 政 府 和 有 关 部 门 也 对 这 个 行业 的 发 展 给 予 了 重视 与 关心 。 
国内 的 认证 中 心 分 为 行业 性 认证 中 心 、 区 域 性 认证 中 心 和 纯 商 业 性 认证 中 心 。 目前 已 在 电信 和 金融 
行业 得 到 了 广泛 应 用 ， 市 场 需求 巨大 。 相 信和 在 不 久 的 将 来 ，PKI 技术 将 发 挥 越 来 越 重要 的 作用 。 

本 章 旨 在 通过 对 PKI 网 络 安全 技术 相关 的 理论 与 技术 的 研究 ， 设 计 并 实现 一 个 具有 较 好 安全 
性 、 通 用 性 和 可 扩展 的 小 型 数字 认证 系统 。 通 过 本 章 的 学 习 ， 可 以 重点 学 到 网 络 安全 领域 中 的 身份 
认证 、 安 全 传输 等 方面 的 知识 。 
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19.2 ”密码 学 基础 知识 


19.2.1 密码 学 概述 


密码 学 〈cryptography) 是 一 种 将 信息 表述 为 不 可 读 的 方式 ， 并 且 使 用 一 种 秘密 的 方法 将 信息 
恢复 出 来 的 科学 。 密 码 学 提供 的 最 基本 的 服务 是 数据 机 密 性 服务 ,就 是 使 通信 双方 可 以 互相 发 送 消 
息 ， 并 且 避 免 他 人 窃取 消息 的 内 容 。 加 密 算 法 是 密码 学 的 核心 。 

任何 加 密 系 统 ， 无 论 实 现 的 算法 如 何不 同 、 形 式 如 何 复杂 ， 其 基本 组 成 部 分 是 相同 的 。 通 常 
包括 以 下 4 部 分 : 


(1) 需要 加 密 的 原始 消息 ， 即 明文 M。 
(2) 用 于 加 密 或 解密 的 钥匙 ， 即 密 钥 K。 
G) 加 密 算法 E 或 者 解密 算法 D。 

(4) 加 密 后 形成 的 消息 ， 即 密 文 C。 


C=Ek(M) 表 示 对 明文 M 使 用 密 钥 K 加 密 后 得 到 密 文 C， 同 样 ，M=Dk (C) 表 示 对 密 文 C 解密 后 
得 到 明文 M。 加 解密 过 程 如 图 19-1 所 示 。 


密 钥 K 






明文 密 文 C=Ek (M) 
[mi 


图 19-1 


19.2.2 ”对 称 密 钥 加 密 技术 

对 称 密 钥 加 密 技术 又 称 为 传统 密 钥 加 密 技术 ， 是 指 在 一 个 加 密 系统 中 ， 通 信 双 方 使 用 同一 密 
H, 或 者 能 够 通过 一 方 的 密 钥 推 导出 另 一 方 的 密 钥 的 加 密 体制 。 对 称 密 钥 加 密 技术 的 模型 如 图 19-2 
所 示 。 








图 19-2 
在 使 用 对 称 密 钥 加 密 时 ， 信 息 交 互 的 双方 必须 使 用 同一 个 密 钥 ， 并 且 这 个 密 钥 还 要 防止 被 他 
人 窃取。 另外 ， 还 要 经 常 对 所 使 用 的 密 钥 进行 更 新 ,减少 攻击 者 获取 密 钥 的 概率 。 因此， 对 称 密 钥 
加 密 技术 的 安全 性 依赖 于 密 钥 分 配 技术 。 
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对 称 密 钥 加 密 技 术 的 特点 在 于 效率 高 、 算 法 简单 、 易 于 实现 、 计 算 开 销 小 ， 适 合 于 对 大 量 数 
据 进行 加 密 。 但 是 它 的 最 大 缺点 是 密 钥 的 安全 性 得 不 到 保证 ， 易 被 攻击 。 所 以 ， 密 钥 分 发 、 密 钥 保 
存 、 密 钥 管理 都 是 对 称 密 钥 加 密 的 缺点 。 在 实际 应 用 中 ， 常 用 的 对 称 密 钥 加 密 技术 有 DES 算法 、 
AES 算法 等 。 


€ DES 算法 :数据 加 密 标准 (Data Encryption Standard) , X & IBM 公司 研制 的 一 种 加 
密 算法 。DES 是 一 个 分 组 加 密 算法 ， 以 64 位 为 分 组 对 数据 加 密 。 加 密 和 解密 使 用 的 
是 同一 个 密 钥 。 它 的 密 钥 长 度 是 56 位 。64 位 的 明文 从 算法 的 一 端 输入 ， 经 过 左右 部 
分 的 迁 代 和 密 钥 的 异 或 、 置 换 等 一 系列 操作 ， 从 另 一 端 输 出 。 

€ AES 算法 :高 级 加 密 标准 ( Advanced Encryption Standard) ， 是 由 美国 国家 标准 技术 
HA (NIST) 在 2001 年 发 布 的 。AES 也 是 一 种 分 组 密码 ， 用 以 取代 DES. AES 作 
为 新 一 代 的 安全 加 密 标 准 ， 集 合 了 强 安全 性 、 高 性 能 、 高 效率 、 易 用 和 灵活 等 优点 ， 
其 分 组 长 度 为 128 位 ， 密 铀 长 度 为 128 位 、192 位 或 256 位 。 


19.23 ”公开 密 钥 加 密 技术 

公开 密 钥 加 密 技术 又 称 为 非 对 称 密 钥 加 密 技 术 ， 与 对 称 密 钥 加 密 技 术 不 同 ， 它 使 用 一 对 密 钥 
分 别 进行 加 密 和 解密 操作 ， 其 中 一 个 是 公开 密 钥 (Public-Key) ， 另 一 个 是 由 用 户 自己 保存 〈 不 能 
公开 ) 的 私有 密 钥 CPrivate-Key) ， 发 送 方 用 公 钥 或 私 钥 进 行 加 密 ， 接 收 方 则 使 用 私 钥 或 公 钥 进行 
解密 。 公 钥 加 密 的 模型 如 图 19-3 所 示 。 


加 密 密 钥 解密 密 钥 
exo Voas 
EX [ m& J— — (wa J| 
图 19-3 


使 用 公 钥 加 密 技 术 时 ， 通 信 双 方 事先 不 需要 通过 通信 信道 进行 密 钥 交 换 ， 并 且 由 于 公 钥 是 公 
开 的 ， 因 此 密 钥 的 持 有 量 得 到 了 减少 ， 密 钥 保 存量 少 、 分 配 简单 ， 便 于 密 钥 的 分 发 与 管理 。 常 用 的 
公开 密 钥 加 密 算法 有 RSA 算法 、DH 算法 等 。 





€ RSA 算法 : 当前 应 用 最 为 广泛 的 公 钥 系统 RSA (Rivest, Shamir, Adleman 三 人 名 字 
的 缩写 ) 是 基于 大 数 因子 分 解 的 复杂 性 来 构造 的 ， 是 公 钥 系统 中 最 典型 的 加 密 算 法 ， 
大 多 数 使 用 公 钥 加 密 技术 进行 加 密 和 数字 签名 的 实际 应 用 使 用 的 都 是 RSA 算法 。 
RSA 算法 如 下 : 


(OD 用 户 选择 两 个 足够 大 的 保密 素数 p、q。 

(2) 计算 n=pq，n 的 欧 拉 函数 为 F(n)=(p-1)(q-1)。 

G) 选择 一 个 相对 比较 大 的 整数 e 作为 加 密 指 数 ， 使 e 与 F(n) 互 素 。 

(4) 解 方程 : ed=1modF(n)， 求 出 解密 指数 d。 

G) WEM. C 分 别 为 要 加 密 的 明文 和 已 被 加 密 的 密 文 ， 则 加 密 运 算 为 C=Me mod n， 解 
密 运算 为 M=Cd mod n。 
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每 个 用 户 都 有 一 个 密 钥 (e,d,n)，(e,n) 是 可 以 公开 的 密 钥 PK，(d,n) 是 用 户 保密 的 密 钥 PR. e 是 
加 密 指数 ，d 是 解密 指数 。 

RSA 算法 的 安全 性 基于 数论 中 大 数 分 解 为 质 因子 的 困难 性 ， 从 一 个 公开 密 钥 加 密 的 密 文 和 公 
钥 中 推导 出 明文 的 难度 等 价 于 分 解 两 个 大 素数 的 乘积 。 可 见 分 解 越 困 难 ， 算 法 的 安全 性 就 越 高 。 


€ DH 算法 :DH (Diffie-Hellman ) 算法 是 最 早 的 公 钥 算法 ， 实 质 上 是 一 个 通信 双方 进行 
密 钥 协定 的 协议 ， 它 的 用 途 仅 限 于 密 钥 交 换 。DH 算法 的 安全 性 依赖 于 计算 离散 对 数 
的 难度 ， 离 散 对 数 的 研究 现状 表明 : 所 使 用 的 DH 密 钥 至 少 需要 1024 位 ， 才 能 保证 
算法 的 安全 性 。 


19.2.4” 单 向 散 列 函 数 算法 


单 向 散 列 函数 算法 也 称 为 报 文摘 要 函数 算法 ， 使 用 单 向 的 散 列 函数 ， 其 实现 过 程 是 从 明文 到 
密 文 的 不 可 逆 的 过 程 。 其 实 就 是 只 能 加 密 而 不 能 将 其 还 原 , 即 理论 上 无 法 通过 反 向 运算 得 到 原始 数 
据 内 容 。 因 此 ， 单 向 散 列 函数 算法 通常 只 用 来 进行 数据 完整 性 验证 。 

单 向 散 列 函数 表达 式 为 hn=H(M)， 其 中 M 是 一 个 变 长 消息 ，H(M) 是 定 长 的 散 列 值 。 消 息 正确 
时 ， 将 散 列 值 附 于 发 送 方 的 消息 后 ， 接 收 方 通过 重新 计算 散 列 值 可 认证 该 消息 。 散 列 函数 必须 具有 
下 列 性 质 : 


COD M 可 应 用 于 任意 大 小 的 数据 块 。 

(D H 产 生 定 长 的 输出 。 

G) 对 任意 给 定 的 M， 计 算 H(M) 比 较 容易 ， 用 硬件 和 软件 均 可 实现 。 

(4) 对 任意 给 定 的 散 列 码 h， 找 到 满足 H(M)-h 的 M 在 计算 上 是 不 可 行 的 ， 称 为 单 向 性 。 

C5) 对 任意 给 定 的 分 组 M， 找 到 满足 N 不 等 于 M H HIM)=HON) 的 NN 在 计算 上 是 不 可 行 的 ， 
称 之 为 抗 弱 碰撞 性 。 

(6) 找到 任何 满足 HIM)=HON) 的 (MN) 在 计算 上 是 不 可 行 的 ， 称 为 抗 强 碰 撞 性 。 


由 于 单 向 函数 在 速度 上 比 对 称 加 密 算法 还 快 ， 因 此 它 被 广泛 应 用 ， 是 数字 签名 和 消息 验证 码 
(MAC) 的 基础 ， 常 用 的 单 向 散 列 函数 算法 有 MD5 和 SHA-1 等 。 


19.2.5 ”数字 签名 基础 知识 


数字 签名 是 指 通过 某 种 密码 运算 生成 一 系列 符号 及 代码 组 成 电子 密码 进行 签名 的 过 程 。 数 字 
签名 是 一 种 认证 机 制 ， 它 以 公 钥 技术 和 单 向 散 列 函 数 为 基础 , 使 得 消息 的 产生 都 可 以 添加 一 个 起 签 
名 作用 的 标识 。 数 字 签 名 是 目前 电子 商务 中 应 用 最 普遍 、 可 操作 性 最 强 、 技 术 最 成 熟 的 一 种 电子 签 
名 方法 , 它 采用 规范 化 的 程序 和 科学 的 方法 , 用 于 鉴定 签名 人 的 身份 以 及 对 一 项 电子 签名 内 容 的 认 
证 。 签名 保证 了 消息 的 来 源 和 完整 性 ， 即 数字 签名 能 验证 出 数据 在 传输 过 程 中 有 无 改变 , 确保 传输 
电子 文件 的 完整 性 、 真 实 性 和 不 可 蔡 代 性 。 数 字 签 名 的 过 程 如 图 19-4 所 示 。 
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发 送 方 接收 方 
Hzzzme mul Eee] — 
发 送 方 A 接收 方 B 
发 送 的 消息 接收 到 的 消息 中 
E | JD5 算 法 IL 
消息 摘要 MD5 (00 消息 摘要 MD5 QD 
发 送 方 公 钥 
B. [Rss 算法 Delo 
数字 签名 
数字 签名 1 m 数字 签名 2 
是 否 相等 
图 19-4 
数字 签名 的 实现 有 下 列 几 个 步骤 。 


CD 发 送 方 使 用 摘要 函数 (如 MD5) 对 信息 M 生成 消息 摘要 MD5(M)。 

(2) 发 送 方 使 用 自己 的 私 钥 用 某 种 数字 签名 算法 来 签名 消息 摘要 〈 用 私 钥 对 摘要 进行 加 密 ) ， 
得 到 数字 签名 。 

(3) 发 送 方 把 消息 M 和 数字 签名 一 起 发 送 给 接收 方 。 

(4). 接收 方 通过 使 用 与 发 送 方 同一 个 摘要 函数 对 接收 的 消息 生成 新 的 摘要 ， 与 1) 中 生成 
的 摘要 进行 对 比 ， 如 果 一 致 ,说 明 收 到 的 消息 没有 被 修改 过 ; 再 使 用 发 送 方 的 公 钥 对 数字 签名 解密 
来 验证 发 送 方 的 签名 。 由 数字 签名 的 过 程 可 以 看 出 ,数字 签名 很 好 地 保证 了 如 下 几 个 方面 的 安全 性 。 

(D 完整 性 : 因为 摘要 函数 算法 实现 的 过 程 是 不 可 道 的 ， 如 果 消 息 在 传输 过 程 中 遭 到 破坏 或 被 
窃取 , 接收 方 根据 接收 到 的 报 文 还 原 出 来 的 消息 摘要 不 同 于 用 公 钥 解密 得 出 的 摘要 , 这 样 保证 了 数 
据 在 传输 过 程 中 的 安全 性 。 

Q 不 可 否认 性 : 由 于 公 钥 与 私 钥 是 一 一 对 应 的 关系 ， 发 送 方 的 私 钥 只 有 自己 知道 ， 因 此 它 不 
否认 已 发 送 的 消息 。 

图 WE: 由 于 公 钥 和 私 钥 是 一 一 对 应 的 关系 ， 因 此 接收 方 用 发 送 方 的 公 钥 计算 出 来 的 摘要 跟 
发 送 方 生成 的 摘要 是 一 致 的 ， 这 样 就 能 证 明 消息 一 定 是 该 发 送 方 发 送出 来 的 。 


19.3 身份 认证 基础 知识 


19.3.1 身份 认证 概述 
身份 认证 常 被 用 于 通信 双方 相互 确认 身份 ， 以 保证 通信 的 安全 ， 是 证 实 被 认证 对 象 是 否 属实 
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和 是 否 有 效 的 一 个 过 程 。 身 份 认 证 是 信息 安全 的 第 一 道 防 线 ， 对 信息 系统 的 安全 有 着 重要 的 意义 ， 
是 信息 安全 体系 的 基础 环节 。 由 于 互联 网 的 广泛 性 和 开放 性 ， 使 得 非法 用 户 可 以 借 机 进行 破坏 ， 他 
们 很 容易 伪造 和 盗用 用 户 的 身份 。 因 此 ， 有 效 的 、 可 信 的 身份 认证 手段 是 确保 整个 安全 系统 可 信和 的 
基础 。 

身份 认证 技术 的 基本 思想 是 通过 验证 被 认证 对 象 的 某 一 特殊 属性 来 达到 确认 被 认证 对 象 是 否 
真实 有 效 的 目的 。 被 认证 对 象 的 属性 可 以 是 口令 、 证 书 、 数 字 签 名 或 者 像 指纹 、 声 音 、 视 网 膜 这 样 
的 生理 特征 。 当 前 ， 网 络 上 流行 的 身份 认证 技术 主要 有 基于 口令 的 认证 、 基 于 智能 卡 的 认证 、 动 态 
口令 认证 、 生 物 特 性 认证 、USB Key 认证 等 ， 这 些 认证 技术 并 非 单独 使 用 ， 有 很 多 认证 过 程 同时 
使 用 多 种 认证 机 制 。 


19.3.2 ”身份 认证 的 方式 


身份 认证 技术 根据 不 同 的 侧重 点 可 以 有 多 种 划分 方式 。 下 面 我 们 根据 认证 方法 将 身份 认证 技 
术 大 致 分 类 如 下 。 


(1) 基于 账号 和 口令 的 用 户 身份 认证 。 系 统 给 每 个 提出 申请 的 用 户 分 配 一 个 具有 唯一 性 的 标 
识 ID， 用 户 设 定 自 己 的 口令 PW) 。 用 户 要 注册 进入 系统 时 ， 向 系统 提交 标识 ID 和 PW， 系 统 
根据 ID 检索 口令 表 得 到 相应 的 PW 。 如 果 两 个 PW 一 致 ， 则 用 户 是 合法 的 ， 系 统 接收 用 户 ， 和 否则 
用 户 被 拒绝 。 基 于 账号 和 口令 的 身份 认证 技术 具有 成 本 低 、 易 实现 、 用 户 界面 友好 等 特点 ， 所 以 目 
前 该 技术 被 一 般 的 计算 机 系统 广泛 采用 。 

(2) 基于 对 称 密 钥 /公开 密 钥 的 用 户 身份 认证 。 数 据 在 信道 中 的 传输 一 般 都 会 采取 对 称 密 钥 / 
公开 密 钥 加 密 措 施 ， 以 保证 数据 传输 过 程 中 的 安全 性 。 在 传统 的 对 称 密 钥 密码 体制 中 ,加密 与 解密 
方法 相同 ， 密 钥 管理 较为 不 便 ， 密 码 体制 单一 且 容 易 被 攻击 或 窃取 。 使 用 基于 公开 密 钥 的 身份 认证 
技术 就 可 以 很 好 地 解决 对 称 加 密 过 程 中 密 钥 无 法 安全 共享 这 一 问题 , 可 以 减轻 因 密 钥 管理 不 善 而 带 
来 的 安全 威胁 。 公 开 密 钥 密 码 体制 的 加 密 和 解密 是 由 通信 双方 使 用 不 同 的 两 个 密 钥 来 实现 的 。 

(3) 基于 KDC 的 身份 认证 。 在 基于 对 称 密 钥 加 密 的 身份 认证 协议 中 ， 需 要 认证 双方 共享 一 
个 对 称 密 钥 ， 但 是 随 着 系统 中 用 户 逐 渐 增 多 ， 密 钥 数 量 就 会 逐渐 变 得 庞大 。 当 用 户 的 数量 较 大 时 ， 
密 钥 的 数量 增长 很 快 ， 也 就 意味 着 密 钥 的 管理 很 难 ， 并 且 增加 了 密 钥 存 储 的 危险 性 ， 降 低 了 身份 认 
证 的 安全 性 。 为 了 减轻 密 钥 管理 的 难度 并 且 降 低 密 钥 的 安全 风险 , 可 增加 一 个 如 密 钥 分 配 中 心 (Key 
Distributed Center, KDC) 这 样 的 可 靠 中 介 机 构 来 保存 和 分 发 密 钥 。 一 般 的 KDC 的 工作 原理 如 图 
19-5 所 示 。 
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图 19-5 
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其 中 ，Ks 是 A 与 KDC 之 间 的 对 称 密 铀 ，Ke 是 B 与 KDC 之 间 的 对 称 密 钥 ，Ks 是 由 KDC 颁 
发 的 A 与 B 之 间 的 对 称 密 钥 ，KDC 给 出 的 Ks(Kab,A) 等 称 为 通知 单 ticket。 常 见 的 基于 KDC 的 身 
份 认 证 协议 有 这 几 种 : Needham-Schroeder 协议 、 扩 展 的 Needham-Schroeder 协议 和 Otway-Rees 认 
证 方法 等 。 

(4) 基于 数字 证 书 的 用 户 身份 认证 。 公 开 密 钥 认 证 方式 中 的 关键 问题 是 确保 公开 密 钥 的 真实 
性 。 现 今 流行 的 一 种 解决 的 办 法 是 采用 数字 证 书 的 方式 来 保证 实体 公开 密 钥 的 真实 性 ， 证 书 由 实 
体 的 身份 标识 、 公 开 密 钥 、 对 身份 标识 和 公开 密 钥 的 数字 签名 以 及 其 他 附加 信息 构成 ,数字 证 书 由 
可 信 的 第 三 方 来 制作 和 颁发 。 其 认证 原理 如 图 19-6 所 示 。 








PKb(A, Ks), Ca 








PKa (B, Ks), Cb 








图 19-6 


TE A 5 B 进行 相互 认证 时 ， 首 先 A 需 获 得 B 的 数字 证 书 Cu， 并 使 用 可 信 的 第 三 方 的 公开 密 
钥 对 Ce 的 签名 进行 验证 ， 通 过 后 生成 会 话 密 钥 Ks， 然 后 用 B 的 公开 密 钥 对 自己 的 身份 标识 A 和 
Ks 进行 加 密 ， 得 到 PKo(A,Ks)， 并 将 结果 和 自己 的 证 书 Ca 一 并 发 送 给 B. B 接收 到 信息 后 ， 同 样 利 
用 可 信 的 第 三 方 提供 的 公开 密 钥 对 证 书 Ca 的 签名 进行 验证 ， 然 后 对 PKo(A,Ks) 进 行 解密 ,再 利用 A 
的 公开 密 钥 对 自己 的 身份 标识 B 和 Ks 进行 加 密 , 将 结果 PKa(B,Ks) 返 回 给 A。A 接收 后 对 其 进行 解 
密 ， 验 证 Ks， 完 成 身份 认证 ， 构 建 会 话 密 钥 Ks。 以 后 双方 的 交互 就 能 建立 在 此 会 话 密 钥 的 基础 上 
进行 。 

(5) 基于 生物 特征 的 用 户 身份 认证 。 生 物 特征 识别 技术 是 通过 计算 机 利用 人 体 所 固有 的 生理 
特征 或 行为 特征 ,如 指纹 、 手 形 或 视网膜 等 来 进行 的 个 人 身份 鉴别 。 目 前 生物 认证 技术 已 被 广泛 使 
Hl. 包括 指纹 识别 、 语 音 识 别 以 及 视网膜 识别 等 。 与 传统 的 身份 鉴别 手段 相 比 ， 基 于 生物 特征 的 用 
户 身份 认证 技术 具有 这 些 优点 : 不 易 遗 忘 或 者 丢失 、 防 伪 性 能 较 好 、 与 拥有 者 具有 绝对 相关 性 。 


PKI 是 以 公开 密 钥 技术 为 基础 并 提供 安全 服务 的 安全 机 制 。 它 提供 公 钥 加 密 和 数字 签名 的 功 
能 ， 并 且 对 密 钥 和 数字 证 书 进 行 管理 。 本 节 重 点 阐述 了 密码 学 基础 与 身份 认证 相关 的 理论 。 首 先 介 
绍 了 对 称 密 钥 加 密 技术 和 公开 密 钥 加 密 技术 , 其 次 介绍 了 单 向 散 列 函数 算法 与 数字 签名 的 原理 , 最 
后 详细 介绍 了 身份 认证 相关 的 理论 与 几 种 常见 的 身份 认证 方式 。 这 些 都 是 PKI 技术 的 基础 。 





19.4 ”密码 编程 的 两 个 重要 库 


密码 编程 如 果 所 有 事情 都 要 从 头 开始 写 ， 结 果 将 是 灾难 性 的 。 幸 亏 开源 界 已 经 为 我 们 提供 了 
两 个 密码 学 相关 的 函数 库 : Cryptot+ 和 OpenSSL， 前 者 是 纯粹 用 C++ 写 的 ， 适 合 C++ 爱好 者 ， 后 
者 是 用 C 语言 写 的， 也 可 以 在 C++ 程序 中 调用 。 从 功能 上 来 讲 ，OpenSSL 更 为 强大 ，OpenSSL 不 
但 提供 了 编程 用 的 API 函数 ， 还 提供 了 强大 的 命令 行 工具 ， 可 以 通过 命令 来 进行 常用 的 加 解密 、 
签名 验证 、 证 书 操作 等 功能 。 
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19.5 OpenSSL 的 简介 


Crypto++ 虽 好 , 但 功能 不 如 OpenSSL, 既 生 瑜 , 何 生 亮 。 一线 开发 中 , 用 的 更 多 的 是 OpenSSL。 
虽然 OpenSSL 是 用 C 语言 写 的 , 但 在 C++ 程 序 中 使 用 完全 没有 问题 , 而且 OpenSSL 很 多 地 方 利用 
面向 对 象 的 设计 方法 与 多 态 来 支持 多 种 加 密 算法 。 所 以 学 好 OpenSSL， 甚 至 分 析 其 源 代码 ， 对 我 
们 提高 面向 对 象 的 设计 能 力 大 有 帮助 。 很 多 著名 的 开源 软件 ， 比 如 内 核 XFRM 框架 、VPN 软件 
strongSwan 等 都 是 用 C 语言 来 实现 面向 对 象 设计 的 。 因此 , 我 们 会 对 OpenSSL 叙述 得 更 为 详细 些 ， 
因为 一 线 实践 开发 中 ， 经 常会 碰 到 这 个 库 的 使 用 很 多 C# 开 发 的 软件 中 ， 底 层 的 安全 连接 也 会 用 
VC 封装 OpenSSL 为 控件 后 ， 供 C# 界 面 使 用 ， 更 不 要 说 Linux 的 一 线 开 发 了 ) ， 和 希望 大 家 能 提前 

随 着 Internet 的 迅速 发 展 和 广泛 应 用 ， 网 络 与 信息 安全 的 重要 性 和 紧迫 性 日 益 突 出 。Netscape 
公司 提出 了 安全 套 接 层 协议 〈Secure Socket Layer, SSL) ， 该 协议 基于 公开 密 钥 技术 ， 可 保证 两 个 
实体 间 通 信 的 保密 性 和 可 靠 性 ， 是 目前 Internet 上 保密 通信 的 工业 标准 。 

Eric A. Young 和 Tim J. Hudson 自 1995 年 开始 编写 后 来 具有 巨大 影响 力 的 OpenSSL 软件 包 ， 
这 是 一 个 没有 太 多 限制 的 开放 源 代码 的 软件 包 , 可 以 利用 这 个 软件 包 做 很 多 事情 .1998 年 ,OpenSSL 
项 目 组 接管 了 OpenSSL 的 开发 工作 ， 并 推出 了 OpenSSL 的 0.9.1 版 。 到 目前 为 止 ，OpenSSL 的 算 
法 已 经 非常 完善 。 对 SSL 2.0、SSL 3.0 以 及 TLS 1.0 都 支持 。OpenSSL 目前 最 新 的 版 本 是 1.1.1 版 。 

OpenSSL 采用 C 语言 作为 开发 语言 ,使 得 OpenSSL 具有 优秀 的 跨 平 台 性 能 ， 可 以 在 不 同 的 平 
台 使 用 。OpenSSL 支持 Linux, Windows, BSD, Mac 等 平台 ， 具 有 广泛 的 适用 性 。OpenSSL 实现 
了 8 种 对 称 加 密 算法 : ES、DES、Blowfish、CAST、IDEA、RC2、RC4、RC5， 实 现 了 4 种 非 对 
称 加 密 算 法 : DH 算法 、RSA 算法 、DSA 算法 和 椭圆 曲线 算法 (ECC) ， 实 现 了 5 种 信息 摘要 算 
ik: MD2. MD5. MDC2. SHAI 和 RIPEMD， 还 提供 了 证 书 相关 的 功能 。 

OpenSSL 的 许可 证 (License) 是 SSLeay License 和 OpenSSL License 的 结合 ， 这 两 种 许可 证 
实际 上 都 是 BSD 类 型 的 许可 证 ， 依 照 许可 证 里 面 的 说 明 ，OpenSSL 可 以 被 用 作 各 种 商业 、 非 商业 
的 用 途 ， 但 是 需要 相应 遵守 一 些 协定 ， 其 实 这 都 是 为 了 保护 自由 软件 作者 对 其 作品 的 权利 。 


19.6 OpenSSL 模块 分 析 


19.6.1 OpenSSL 源 代码 模块 结构 


OpenSSL 整个 软件 包 大 概 可 以 分 成 3 个 主要 的 功能 部 分 : 密码 算法 库 、SSL 协议 库 以 及 应 用 
程序 。OpenSSL 的 目录 结构 也 是 围绕 这 3 个 功能 部 分 进行 规划 的 ， 具 体 如 表 19-1 所 示 。 


3k 19-1 OpenSSL 的 目录 结构 





目录 名 功能 描述 





Crypto 所 有 加 密 算法 源 代 码 文件 和 相关 标准 〈 如 X.509 源 代码 文件 ) ， 是 OpenSSL 中 最 
重要 的 目录 ， 包 含 OpenSSL 密码 算法 库 的 所 有 内 容 
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( 续 表 ) 

目录 名 功能 描述 

SSL SSL 中 存放 OpenSSL 中 SSL 协议 各 个 版 本 和 TLS 1.0 协议 源 代码 文件 ， 包 含 
OpenSSL 协议 库 的 所 有 内 容 

Apps 存放 OpenSSL 中 所 有 应 用 程序 源 代 码 文件 ， 如 CA、X509 等 应 用 程序 的 源 文件 就 
存放 在 这 里 

Docs 存放 OpenSSL 中 所 有 的 使 用 说 明文 档 ， 包 含 3 部 分 : 应 用 程序 说 明文 档 、 加 密 算 
法 库 API 说 明文 档 以 及 SSL 协议 API 说 明文 档 

Demos 存放 一 些 基于 OpenSSL 的 应 用 程序 例子 ， 这 些 例子 一 般 都 很 简单 ， 演 示 怎 么 使 用 
OpenSSL 中 的 功能 

Include 存放 使 用 OpenSSL 的 库 时 需要 的 头 文件 








Test 存放 OpenSSL 自身 功能 测试 程序 的 源 代码 文件 

OpenSSL 的 算法 目录 Crypto 包含 OpenSSL 密码 算法 库 的 所 有 源 代码 文件 ， 是 OpenSSL 中 最 
重要 的 目录 之 一 。OpenSSL 的 密码 算法 库 包含 OpenSSL 中 所 有 密码 算法 、 密 钥 管理 和 证 书 管理 相 
关 标 准 的 实现 。 


19.6.2 OpenSSL 加 密 库 调 用 方式 


OpenSSL 是 全 开放 的 、 开 放 源 代码 的 工具 包 ， 实 现 安全 套 接 层 协议 〈SSLv2/v3) 和 传输 层 安 
全 协议 〈TLSv1) ， 并 形成 一 个 功能 完整 的 通用 目的 的 加 密 库 SSLeay。 应 用 程序 可 通过 3 种 方式 
调用 SSLeay， 如 图 19-7 所 示 。 











































































































应 用 程序 
其 他 层次 
OpenSSL 加 密 库 接口 (如 : RSA EVP) 
Engine 安 全 平台 
| 
OpenSSL SSLeay 
Aep Ubsec Testone) || angine 
engine engine eene 
<+ 
Aep Ubsec Weston 
CSP CSP CSP 
图 19-7 
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一 是 直接 调用 ， 二 是 通过 OpenSSL 加 密 库 接口 调用 ， 三 是 通过 Engine 平台 和 OpenSSL 对 象 
调用 。 除 了 SSLeay 外 ， 用 户 可 通过 Engine 安全 平台 访问 CSP。 

使 用 Engine 技术 的 OpenSSL 已 经 不 仅仅 是 一 个 密码 算法 库 , 而 是 一 个 提供 通用 加 解密 接口 的 
安全 框架 ,在 使 用 时 ， 只 要 加 载 了 用 户 的 Engine 模块 ， 应 用 程序 中 所 调用 的 OpenSSL 加 解密 函数 
就 会 自动 调用 用 户 自己 开发 的 加 解密 函数 来 完成 实际 的 加 解密 工作 。 这 种 方法 将 底层 硬件 的 复杂 多 
样 性 与 上 层 应 用 分 隔 开 ， 大 大 降低 了 应 用 开发 的 难度 。 


19.6.3 OpenSSL 支持 的 对 称 加 密 算法 


OpenSSL 一 共 提供 了 8 种 对 称 加 密 算法 ， 其 中 7 种 是 分 组 加 密 算 法 ， 仅 有 一 种 流 加 密 算 法 是 
RC4。 这 7 种 分 组 加 密 算法 分 别 是 AES、DES、Blowfish、CAST、IDEA、RC2、RC5， 都 支持 电 
子 密码 本 模式 CECBO 、 加 密 分 组 链接 模式 (CBC) 、 加 密 反馈 模式 (CFB) 和 输出 反馈 模式 (OFB) 
4 种 常用 的 分 组 密码 加 密 模式 。 其 中 ，AES 使 用 的 加 密 反 馈 模 式 (CFB〉 和 输出 反馈 模式 (OFB) 
分 组 长 度 是 128 位 ， 其 他 算法 使 用 的 则 是 64 位 。 事 实 上 ，DES 算法 里 面 不 仅仅 是 常用 的 DES 算 
法 ， 还 支持 三 个 密 钥 和 两 个 密 钥 3DES 算法 。OpenSSL 还 使 用 EVP 封装 了 所 有 的 对 称 加 密 算法 ， 
使 得 各 种 对 称 加 密 算法 能 够 使 用 统一 的 API 接口 EVP_Encrypt 和 EVP_Decrypt 进行 数据 的 加 密 和 
解密 ， 大 大 提高 了 代码 的 可 重用 性 能 。 


19.6.4 OpenSSL 支持 的 非 对 称 加 密 算法 


OpenSSL 一 共 实 现 了 4 种 非 对 称 加 密 算 法 ， 包 括 DH 算法 、RSA 算法 、DSA 算法 和 椭圆 曲线 
算法 (ECC) 。DH 算法 一 般 用 于 密 钥 交 换 ; RSA 算法 既 可 以 用 于 密 钥 交换 ， 也 可 以 用 于 数字 签名 ， 
当然 ， 如 果 你 能 够 忍受 其 缓慢 的 速度 ， 那 么 也 可 以 用 于 数据 加 解密 ; DSA 算法 则 一 般 只 用 于 数字 
签名 。 

跟 对 称 加 密 算法 相似 ，OpenSSL 也 使 用 EVP 技术 对 不 同 功能 的 非 对 称 加 密 算法 进行 封装 ， 提 
供 了 统一 的 API 接口 。 如 果 使 用 非 对 称 加 密 算法 进行 密 钥 交换 或 者 密 钥 加 密 ， 则 使 用 EVPSeal 和 
EVPOpen 进行 加 密 和 解密 ;如果 使 用 非 对 称 加 密 算法 进行 数字 签名 ， 则 使 用 EVP Sign 和 
EVP_Verify 进行 签名 和 验证 。 


19.6.5 OpenSSL 支持 的 信息 摘要 算法 


OpenSSL 实现 了 5 种 信息 摘要 算法 ,分别 是 MD2、MD5、MDC2、SHA(SHA1) 和 RIPEMD。 
SHA 算法 事实 上 包括 SHA 和 SHAI 两 种 信息 摘要 算法 。 此 外 ，OpenSSL 还 实现 了 DSS 标准 中 规 
定 的 两 种 信息 摘要 算法 : DSS 和 DSS1。 

OpenSSL 采用 EVPDigest 接口 作为 信息 摘要 算法 统一 的 EVP 接口 ， 对 所 有 信息 摘要 算法 进行 
了 封装 ,提供 代码 的 重用 性 。 当 然 ， 跟 对 称 加 密 算法 和 非 对 称 加 密 算法 不 一 样 ， 信 息 摘要 算法 是 不 
可 北 的 ， 不 需要 一 个 解密 的 逆 函 数 。 


19.6.6 OpenSSL 密 钥 和 证 书 管理 


OpenSSL 实现 了 ASN.1 的 证 书 和 密 钥 相关 标准 ， 提 供 了 对 证 书 、 公 钥 、 私 钥 、 证 书 请 求 以 及 
CRL 等 数据 对 象 的 DER、PEM 和 BASE64 的 编 解 码 功 能 。 OpenSSL 提供 产生 各 种 公开 密 钥 对 和 对 
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称 密 钥 的 方法 、 函 数 和 应 用 程序 ， 同 时 提供 对 公 铀 和 私 钥 的 DER 编 解码 功能 ， 并 实现 了 私 钥 的 
PKCS#12 和 PKCS#8 的 编 解码 功能 。OpenSSL 在 标准 中 提供 对 私 钥 的 加 密 保 护 功能 ， 使 得 密 钥 可 
以 安全 地 进行 存储 和 分 发 。 

在 此 基础 上 ，OpenSSL 实现 了 对 证 书 的 X.509 标准 编 解码 、PKCS#12 格式 的 编 解码 以 及 
PKCS#7 的 编 解码 功能 ， 并 提供 了 一 种 文本 数据 库 ， 支 持 证 书 的 管理 功能 ， 包 括 证 书 密 钥 产 生 、 请 
求 产 生 、 证 书签 发 、 吊 销 和 验证 等 功能 。 

事实 上 ，OpenSSL 提供 的 CA 应 用 程序 就 是 一 个 小 型 的 证 书 管理 中 心 (CA) ， 实 现 了 证 书签 
发 的 整个 流程 和 证 书 管理 的 大 部 分 机 制 。 


19.7 面向 对 象 与 OpenSSL 


OpenSSL 支持 常见 的 密码 算法 。OpenSSL 成 功 地 运用 了 面向 对 象 的 方法 与 技术 ， 才 使 得 它 能 
支持 众多 算法 并 能 实现 SSL 协议 。OpenSSL 的 可 贵 之 处 在 于 它 利用 面向 过 程 的 C 语 言 去 实现 面向 
对 象 的 思想 。 

面向 对 象 方法 是 一 种 运用 对 象 、 类 、 继 承 、 封 装 、 聚 合 、 消 息 传递 、 多 态 性 等 概念 来 构造 系 
统 的 软件 开发 方法 。 

面向 对 象 方法 与 技术 起 源 于 面向 对 象 的 编程 语言 (OOPL) 。 但 是 ， 面 向 对 象 不 仅 是 一 些 具体 
的 软件 开发 技术 与 策略 , 而 且 是 一 整套 关于 如 何 看 待 软件 系统 与 现实 世界 的 关系 、 以 什么 观点 来 研 
究 问 题 并 进行 求解 以 及 如 何 进行 系统 构造 的 软件 方法 学 。 概 括 地 说 ， 面 向 对 象 方法 的 基本 思想 是 ， 
从 现实 世界 中 客观 存在 的 事物 (对象 出 发 来 构造 软件 系统 ,并 在 系统 构造 中 尽 可 能 运用 人 类 的 自 
然 思维 方式 。 面向 对 象 方法 强调 直接 以 问题 域 (现实 世界 ) 中 的 事物 为 中 心 来 思考 问题 、 认 识 问题 ， 
并 根据 这 些 事物 的 本 质 特征 , 把 它们 抽象 地 表现 为 系统 中 的 对 象 ， 作 为 系统 的 基本 构成 单位 。 这 可 
以 使 系统 直接 地 映射 问题 域 ， 保 持 问 题 域 中 事物 及 其 互相 关系 的 本 来 面貌 。 

结构 化 方法 采用 许多 符合 人 类 思维 习惯 的 原则 与 策略 (如 自 项 向 下 、 逐 步 求 精 ) 。 面 向 对 象 
方法 则 更 加 强调 运用 人 类 在 日 常 逻辑 思维 中 经 常 采用 的 思想 方法 与 原则 ， 例 如 抽象 、 分 类 、 继 承 、 
聚合 、 封 装 等 。 这 使 得 软件 开发 者 能 更 有 效 地 思考 问题 ， 并 以 其 他 人 也 能 看 得 懂 的 方式 把 自己 的 认 
识 表达 出 来 。 有 具体 地 讲 ， 面 向 对 象 方法 有 以 下 一 些 主要 特点 


(1) 从 问题 域 中 客观 存在 的 事物 出 发 来 构造 软件 系统 ， 用 对 象 作为 这 些 事物 的 抽象 表示 ， 并 
以 此 作为 系统 的 基本 构成 单位 。 

(2) 事物 的 静态 特征 〈 可 以 用 一 些 数据 来 表达 的 特征 ) 用 对 象 的 属性 表示 ， 事 物 的 动态 特征 
〈 事 物 的 行为 ) 用 对 象 的 服务 表示 。 

《3) 对 象 的 属性 与 服务 结合 成 一 体 , 成 为 一 个 独立 的 实体 , 对 外 屏蔽 其 内 部 细节 ( 称 作 封 装 ) 。 

(4) 对 事物 进行 分 类 。 把 具有 相同 属性 和 相同 服务 的 对 象 归 为 一 类 ， 类 是 这 些 对 象 的 抽象 描 
述 ， 每 个 对 象 是 它 的 类 的 一 个 实例 。 

C5) 通过 在 不 同 程度 上 运用 抽象 的 原则 〈 较 多 或 较 少 地 忽略 事物 之 间 的 差异 ) ， 可 以 得 到 较 
一 般 的 类 和 较 特殊 的 类 。 子 类 继承 超 类 的 属性 与 服务 , 面向 对 象 方法 支持 对 这 种 继承 关系 的 描述 与 
实现 ， 从 而 简化 系统 的 构造 过 程 及 其 文档 。 
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(6) 复杂 的 对 象 可 以 用 简单 的 对 象 作 为 其 构成 部 分 〈 称 作 聚 合 ) 。 
CD 对 象 之 间 通 过 消息 进行 通信 ， 以 实现 对 象 之 间 的 动态 联系 。 
(8) 通过 关联 表达 对 象 之 间 的 静态 关系 。 


概括 以 上 几 点 , 在 用 面向 对 象 方法 开发 的 系统 中 , 以 类 的 形式 进行 描述 并 通过 对 类 的 引用 而 创 
建 的 对 象 是 系统 的 基本 构成 单位 。 这 些 对 象 对 应 着 问题 域 中 的 各 个 事物 , 它们 内 部 的 属性 与 服务 刻 
画 了 事物 的 静态 特征 和 动态 特征 。 对 象 类 之 间 的 继承 关系 、 聚 合 关系 、 消 息 和 关联 如 实地 表达 了 问 
题 域 中 事物 之 间 实 际 存在 的 各 种 关系 。 因 此 , 无 论 是 系统 的 构成 成 分 ,还 是 通过 这 些 成 分 之 间 的 关 
系 而 体现 的 系统 结构 ， 都 可 以 直接 映射 问题 域 。 

面向 对 象 方法 代表 一 种 贴近 自然 的 思维 方式 ， 它 强调 运用 人 类 在 日 常 逻辑 思维 中 经 常 采用 的 
思想 方法 与 原则 。 面 向 对 象 方法 中 的 抽象 、 分 类 、 继 承 、 聚 合 、 封 装 等 思维 方法 和 分 析 手 段 能 有 效 
地 反映 客观 世界 中 事物 的 特点 和 相互 的 关系 。 而 面向 对 象 方法 中 的 继承 、 多 态 等 特点 可 以 提高 过 程 
模型 的 灵活 性 、 可 重用 性 。 因 此 ,应 用 面向 对 象 的 方法 将 降低 工作 流 分 析 和 建 模 的 复杂 性 ， 并 使 工 
作 流 模型 具有 较 好 的 灵活 性 ， 可 以 较 好 地 反映 客观 事物 。 

在 OpenSSL 源 代码 中 ， 将 文件 及 网 络 操作 封装 成 BIO. BIO 几乎 封装 了 除了 证 书 处 理 外 
OpenSSL 所 有 的 功能 ， 包 括 加 密 库 以 及 SSL/TLS 协议 。 当 然 , 它们 都 只 是 在 OpenSSL 其 他 功能 之 
上 封装 搭建 起 来 的 ， 却 方便 了 不 少 。OpenSSL 对 各 种 加 密 算法 封装 就 可 以 使 用 相同 的 代码 但 采用 
不 同 的 加 密 算法 进行 数据 的 加 密 和 解密 。 











19.7.1 BIO 接口 


在 OpenSSL 源 代码 中 , IO 操作 主要 有 网 络 操作 、 磁盘 操作 。 为 了 方便 调用 者 实现 其 VO 操作 
OpenSSL 源 代码 中 将 所 有 与 VO 操作 有 关 的 函数 进行 统一 封装 ,， 即 无 论 是 网 络 还 是 磁盘 操作 ， 其 接 
口 是 一 样 的 。 对 于 函数 调用 者 来 说 ， 以 统一 的 接口 函数 去 实现 其 真正 的 VO 操作 。 

为 了 达到 此 目的 ，OpenSSL 采用 BIO 抽象 接口 。BIO 是 在 底层 覆盖 了 许多 类 型 UO 接口 细节 
的 一 种 应 用 接口 ， 如 果 在 程序 中 使 用 BIO， 就 可 以 和 SSL 连接 、 非 加 密 的 网 络 连接 、 文 件 UO 进 
行 透明 的 连接 。BIO 接口 的 定义 如 下 : 

struct bio st 


METHOD *method; 
m 
Ji}, BIO METHOD 结构 体 是 各 种 函数 的 接口 定义 。 如 果 是 文件 操作 ， 此 结构 体 如 下 : 


static BIO METHOD methods filep- 
t 

BIO TYPE FILE, 

"FILE pointer", 

file write, 

file read, 

file puts, 
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file gets, 
file ctrl, 
file new, 
file free, 
NULL, 
N 
以 上 是 定义 7 个 文件 操作 的 接口 函数 的 入 口 。 这 7 个 文件 操作 函数 的 具体 实体 与 操作 系统 提 
供 的 API 有 关 。BIO_METHOD 结构 体 如 果 用 于 网 络 操作 ， 其 结构 体 如 下 : 


staitc BIO METHOD methods sockp- 
t 
BIO TYPE SOCKET, 
"socket", 
Sock write, 
Sock read, 
Sock puts, 
Sock ctrl, 
sock new, 
Sock free, 
NULL, 
E 
它 跟 文件 类 型 BIO 在 实现 的 动作 上 基本 是 一 样 的 ， 只 不 过 是 前 级 名 和 类 型 字段 的 名 称 不 一 样 。 
其 实在 像 Linux 这 样 的 系统 里 ，Socket 类 型 跟 fd 类 型 是 一 样 的 ， 它 们 可 以 通用 ， 但 是 为 什么 要 分 
开 来 实现 呢 ? 那 是 因为 有 些 系统 〈 如 Windows 系统 ) H, Socket 跟 文 件 描述 符 是 不 一 样 的 ， 所 以 
为 了 平台 的 兼容 性 ，OpenSSL 就 将 这 两 类 分 开 了 。 


19.7.20 EVP 接口 
EVP 系列 的 函数 定义 包含 在 “evp.h” 里 面 ， 这 是 一 系列 封装 了 OpenSSL 加 密 库 里 面 所 有 算法 
的 函数 。 通 过 这 样 统一 的 封装 ， 使 得 只 需要 在 初始 化 参数 的 时 候 做 很 少 的 改变 ， 就 可 以 使 用 相同 的 
代码 但 采用 不 同 的 加 密 算法 进行 数据 的 加 密 和 解密 。 
EVP 系列 函数 主要 封装 了 三 大 类 型 的 算法 ， 要 全 部 支持 这 些 算 法 ， 需 调用 
OpenSSL addall algorithms 函数 。 
(OD 公开 密 钥 算法 
€ 函数 名 称 : EVPSeal*..*, EVPOpen*...*, 
€ ”功能 描述 : 该 系列 函数 封装 提供 了 公开 密 钥 算法 的 加 密 和 解密 功能 ， 实 现 了 电子 信封 
的 功能 。 
€ ”相关 文件 : p_seal，p_open.c。 
(2) 数字 签名 算法 
€ 函数 名 称 : EVP Sign*..*. EVP Verify*..*. 
€ “功能 描述 : 该 系列 函数 封装 提供 了 数字 签名 算法 的 功能 。 
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€ ”相关 文件 : p sign.c, p verify.c. 

(3) 对 称 加 密 算法 

€ ”函数 名 称 : EVP_Encrypt*...*。 

€ 功能 描述 : 该 系列 函数 封装 提供 了 对 称 加 密 算法 的 功能 。 
€ ”相关 文件 : evp_enc.c, p_enc.c, p_dec.c, e_*.c. 

(4) 信息 摘要 算法 

€ 函数 名 称 : EVPDigest*...*. 

€ 功能 描述 : 该 系列 函数 封装 实现 了 多 种 信息 摘要 算法 。 
© ”相关 文件 : digestc, m *.c. 

(5) 信息 编码 算法 


€ 函数 名 称 : EVPEncode*...*, 
€ 功能 描述 : 该 系列 函数 封装 实现 了 ASCH 码 与 二 进 制 码 之 间 的 转换 函数 和 功能 。 


19.8 OpenSSL 的 下 载 、 编 译 和 升级 安装 


前 面 讲 了 不 少 理论 知识 ， 虽 然 枯燥 ， 但 可 以 从 宏观 层面 上 对 OpenSSL 进行 高 屋 建 领 的 了 解 ， 
这 样 以 后 走 迷 宫 的 时 候 不 至 于 迷路 。 下 面 进入 实战 环节 。 打 开 官 网 下 载 源 代码 。OpenSSL 的 官网 
地 址 是 : https://www.openssl.org。 这 里 使 用 的 版 本 是 1.0.2m， 不 求 最 新 ， 但 求 稳定 ， 这 是 一 线 开发 
者 的 原则 。 另 外 要 注意 的 是 ，OpenSSL 官方 现在 已 停止 对 0.9.8 和 1.0.0 两 个 版 本 的 升级 维护 。 这 
里 下 载 下 来 的 是 一 个 压缩 文件 ，openssl-1.0.2m.tar。 

刚 下 载 下 来 不 能 马上 安装 ， 先 要 看 看 现在 操作 系统 中 是 否 已 经 安装 了 ， 可 以 用 下 列 命令 进行 
查看 : 

[root@localhost ~]# rpm -ql openssl 

或 者 直接 查询 OpenSSL 版 本 : 


[root@localhost ~]# openssl version 
OpenSSL 1.0.1e-fips 11 Feb 2013 


可 以 看 出 ， 在 笔者 的 CentOS 7 上 已 经 预先 装 了 OpenSSL1.0.1e 版 本 ， 如 果 要 查看 这 个 版 本 更 
为 详细 的 信息 ， 可 以 输入 命令 : 


[root@localhost ~]# openssl version -a 

OpenSSL 1.0.1e-fips 11 Feb 2013 

built on: Mon Jun 29 12:45:07 UTC 2015 

platform: linux-x86 64 

options: bn(64,64) md2(int) rc4(16x,int) des(idx,cisc,16,int) idea(int) 
blowfish(idx) 

compiler: gcc -fPIC -DOPENSSL PIC -DZLIB -DOPENSSL THREADS -D REENTRANT 
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-DDSO DLFCN -DHAVE DLFCN H -DKRB5 MIT -m64 -DL ENDIAN -DTERMIO -Wall -02 -g -pipe 
-Wall -Wp,-D FORTIFY SOURCE-2 -fexceptions -fstack-protector-strong 
--param-ssp-buffer-size-4 -grecord-gcc-switches -m64 -mtune-generic 
-Wa,--noexecstack -DPURIFY -DOPENSSL IA32 SSE2 -DOPENSSL BN ASM MONT 
-DOPENSSL BN ASM MONT5 -DOPENSSL BN ASM GF2m -DSHA1 ASM -DSHA256 ASM -DSHA512 ASM 
-DMD5 ASM -DAES ASM -DVPAES ASM -DBSAES ASM -DWHIRLPOOL ASM -DGHASH ASM 
OPENSSLDIR: "/etc/pki/tls" 
engines: rdrand dynamic 


其 实 ， 也 就 是 加 了 -a 选项 。 
把 下 载 下 来 的 压缩 文件 放 到 Linux 后 解压 缩 : 


[root@localhost soft]# tar zxf openssl-1.0.2m.tar.gz 
进入 解压 后 的 文件 夹 ， 开 始 配置 、 编 译 、 安 装 : 


[root@localhost soft]# cd openssl-1.0.2m/ 
[root@localhost openssl-1.0.2m]# ./config shared zlib 
[root@localhost openss1-1.0.2m]# make 

[root@localhost openss1-1.0.2m]# make install 


稍 等 片刻 安装 完成 。 接 着 ， 删 除 两 个 备份 文件 : 


mv /usr/bin/openssl /usr/bin/openssl.bak 
mv /usr/include/openssl /usr/include/openssl.bak 


再 创建 两 个 软 链接 : 


1n -s /usr/local/ssl/bin/openssl /usr/bin/openssl 
ln -s /usr/local/ssl/include/openssl /usr/include/openssl 


最 后 添加 路 径 到 动态 库 配 置 文件 并 更 新 : 


echo "/usr/local/ssl/lib" >> /etc/ld.so.conf 
ldconfig -v 


至 此 ， 升 级 安装 工作 完成 了 。 我 们 可 以 看 一 下 现在 OpenSSL 的 版 本 号 : 


[root@localhost bin]# openssl version 
OpenSSL 1.0.2m 2 Nov 2017 


版 本 升级 成 功 了 。 趁 热 打铁 ， 下 面 马 上 编写 一 个 OpenSSL 的 C++ 程序 ， 以 此 验证 开发 环境 是 
否 建立 起 来 了 。 
【 例 19.1] 第 一 个 OpenSSL 的 C++ 程序 
(1) 打开 UE， 输 入 代码 如 下 : 


#include <iostream> 
using namespace std; 


#include "openssl/evp.h" // 包 含 相关 openss1 头 文件 ， 位 于 
/usr/local/ssl/include/openssl/evp.h 
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int main(int argc, char *argv[]) 
t 
char sz[] = "Hello, OpenSSL!"; 
cout «« sz «« endl; 
OpenSSL add all algorithms(); // 载 入 所 有 SSL 算 法 ， 这 个 函数 是 openss1 库 中 的 函数 
return 0; 


) 


代码 很 简单 ， 只 调用 了 一 个 OpenSSL 的 库 函 数 OpenSSL. add all algorithms, 该 函数 的 作用 是 
载 入 所 有 SSL 算法 ， 这 里 调用 就 是 为 了 看 看 能 否 调用 得 起 来 。 
evp.h 的 路 径 是 /usr/local/ssl/include/opensslevp.h， 它 包含 常用 密码 算法 的 声明 。 


(2) 保存 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 运行 : 


[root@localhost test]# g++ test.cpp -o test -lcrypto 
[root@localhost test]# ./test 
Hello, OpenSSL! 


运行 成 功 了 。 编 译 的 时 候 要 注意 链接 OpenSSL 的 动态 库 Crypto， 这 个 库 文件 位 于 
/usr/lib64/libcrypto.so， 是 一 个 动态 库 ， 提 供 了 OpenSSL 的 常用 算法 。 

有 读者 可 能 会 问 ，evp.h 的 存放 路 径 是 /usr/local/ssl/include/openssl/evp.h， 编 译 的 时 候 为 什么 不 
用 -I 包含 头 文件 的 路 径 呢 ? 答案 是 我 们 在 安装 OpenSSL 库 的 时 候 ， 该 路 径 已 经 写 到 环境 变量 中 去 
了 ， 可 以 用 env 命令 查看 : 


[rootélocalhost test]# env 
XDG SESSION ID-37 
HOSTNAME-localhost.localdomain 


MAIL-/var/spool/mail/root 

PATH-/usr/lib64/qt-3.3/bin:/root/perl5/bin:/usr/local/sbin:/usr/local/bin: 
/usr/sbin:/usr/bin:/root/bin 

PWD-/zww/test 

LANG-zh CN.UTF-8 

KDEDIRS-/usr 

SELINUX LEVEL REQUESTED- 

HISTCONTROL-ignoredups 

SHLVL-1 

HOME-/root 

PERL LOCAL LIB ROOT-:/root/perl5 

LOGNAME-root 

QTLIB-/usr/lib64/qt-3.3/lib 

SSH CONNECTION-172.16.2.5 2177 172.16.2.6 22 

LESSOPEN-||/usr/bin/lesspipe.sh $s 

XDG RUNTIME DIR-/run/user/0 

QT PLUGIN PATH-/usr/lib64/kde4/plugins:/usr/lib/kde4/plugins 

PERL MM OPT-INSTALL BASE-/root/perl5 

OLDPWD-/usr/local/ssl/include/openssl 
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_=/usr/bin/env 
[root@localhost test]# 


大 家 可 以 看 末尾 倒数 第 二 行 ，env 命令 用 于 显示 系统 中 已 存在 的 环境 变量 。 


19.9 对称 加 解密 算法 的 分 类 


对 称 加 解密 算法 可 以 分 为 流 加 解密 算法 和 分 组 加 解密 算法 ， 分 组 加 解密 算法 又 称 为 块 加 解密 
算法 。 


19.9.1. 流 对 称 算法 


加 密 和 解密 双方 使 用 相同 伪 随 机 加 密 数据 流 〈 密 钥 ) ， 一 般 都 是 逐 位 异 或 或 者 随机 置换 数据 
内 容 ， 常 见 的 流 加 密 算法 如 RC4。 

流 加 密 中 ， 密 钥 的 长 度 和 明文 的 长 度 是 一 致 的 。 假 设 明 文 的 长 度 是 n 比特 ， 那 么 密 钥 也 为 n 
比特 。 流 密码 的 关键 技术 在 于 设计 一 个 良好 的 “ 密 钥 流 生成 器 ”， 即 由 种 子 密 钥 通 过 密 钥 流 生成 器 
生成 伪 随 机 流 。 通 信 双 方 交 换 种 子 密 钥 即 可 (已 拥 有 相同 的 密 钥 流 生成 器 ) ， 具 体 参 见 图 19-8。 





密 钥 流 生成 器 必须 
有 生成 一 定 随 机 流 
的 能 力 





密 钥 K 长 度 短 ， 好 记 


图 19-8 


19.9.2 ”分 组 对 称 算法 


分 组 对 称 算法 也 称 分 组 加 密 算法 或 块 加 密 算 法 , 将 明文 分 成 多 个 等 长 的 块 Cblock, 或 称 分 组 ) 
使 用 确定 的 算法 和 对 称 密 钥 对 每 组 分 别 加 密 解密 。 通俗 地 讲 , 就 是 一 组 一 组 地 进行 加 解密 , 而且 每 
组 数据 长 度 相同 。 

有 人 或 许 会 想 ， 既 然 是 一 组 一 组 地 加 解密 ， 那 么 程序 是 否 可 以 设计 成 并 行 加 解密 呢 ? 比如 多 
核 计 算 机 上 开 n 个 线程 同时 可 以 对 n 个 分 组 进行 加 解密 , 这 个 想法 不 完全 正确 。 因 为 分 组 和 分 组 之 
间 可 能 存在 关联 。 这 就 引出 了 分 组 算法 的 模式 概念 。 分 组 算法 的 模式 用 来 确定 分 组 之 间 是 否 有 关联 
以 及 如 何 关 联 的 问题 。 

通常 分 组 算法 有 5 种 加 密 模式 ， 如 表 19-2 所 示 。 


*680°* 
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表 19-2 分 组 算法 的 5 种 加 密 模 式 





加 密 模 式 
ECB (Electronic Code Book， 电 子 密码 本 模式 ) 分 组 之 间 没 关联 ， 简 单 快速 ， 可 并 行 计算 
CBC (Cipher Block Chaining， 密 码 分 组 链接 模式 ) | 仅 解 密 支 持 并 行 计算 

















CFB (Cipher Feedback Mode， 加 密 反馈 模式 ) 仅 解 密 支 持 并 行 计算 
OFB (Output Feedback Mode， 输 出 反馈 模式 ) 不 支持 并 行 运 算 
CTR (Counter， 计 算 器 模式 ) 支持 并 行 计算 

1. ECB 模式 


ECB 模式 是 最 早 采 用 的 和 最 简单 的 模式 ， 它 将 加 密 的 数据 分 成 若干 组 ， 每 组 的 大 小 跟 加 密 密 
钥 长 度 相 同 ， 然 后 每 组 都 用 相同 的 密 钥 进行 加 密 。 相 同 的 明文 会 产生 相同 的 密 文 。 其 缺点 是 : ECB 
模式 用 一 个 密 钥 加 密 消息 的 所 有 块 , 如 果 原 消息 中 的 明文 块 重复 , 则 加 密 消息 中 的 相应 密 文 块 也 会 
重复 。 因 此 ， 电 子 密码 本 模式 适用 于 加 密 短 消息 。ECB 模式 的 具体 过 程 如 图 19-9 所 示 。 


Plaintext Plaintext Plaintext 

CEEEEEEI I IIILILI 
MA M MA 

Block Cipher Block Cipher Block Cipher 

Key —»| Encryption Key —» | Encryption Key 一 ~ Encryption 
M t à j 

I I LI LI 

Ciphertext Ciphertext Ciphertext 


Electronic Codebook (ECB) mode encryption ^n 


Ciphertext Ciphertext Ciphertext 
LLLLLLI LLLILILII LLLIIIII] 
t ' Y 
Block Cipher Block Cipher Block Cipher 
Key — | Decryption Key =. Decryption Key — | Decryption 
' ' 
ITITITI LLLIIITIT ITIIITIT] 
Plaintext Plaintext Plaintext 


Electronic Codebook (ECB) mode decryption 解密 
图 19-9 
图 19-9 中 ， 每 个 分 组 的 运算 (加 密 或 解密 ) 都 是 独立 的 ， 每 个 分 组 加 密 只 需要 密 钥 和 该 明文 
分 组 即 可 ,每 个 分 组 解密 也 只 需要 密 钥 和 该 密 文 分 组 即 可 。 这 就 产生 了 一 个 问题 , 即 加 密 时 相同 内 
容 的 明文 块 将 得 到 相同 的 密 文 块 〈 密 钥 是 相同 的 ， 输 入 是 相同 的 ， 得 到 的 结果 也 就 相同 了 ) ， 这 样 
就 难以 抵抗 统计 分 析 攻 击 了 。 当 然 ，ECB 每 组 没关系 也 是 其 优点 ， 比 如 有 利于 并 行 计算 、 误 差 不 
会 被 传送 、 运 算 简单 不 需要 初始 向 量 (Initialization Vector, IV) 。 
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2. CBC 模式 


CBC 模式 由 IBM 于 1976 年 发 明 。 加 密 时 ， 第 一 个 明文 块 和 初始 向 量 进行 异 或 后 ， 再 用 key 
进行 加 密 ， 以 后 每 个 明文 块 与 前 一 个 分 组 结果 ( 密 文 块 ) 进行 异 或 后 , 再 用 key 进行 加 密 。 解密 时 ， 
第 一 个 密 文 块 先 用 key 解密 , 得 到 的 中 间 结 果 再 与 初始 向 量 进行 异 或 得 到 第 一 个 明文 分 组 (第 一 个 
分 组 的 最 终 明 文 结果 ) ， 后 面 每 个 密 文 块 也 是 先 用 key 解密 ,得 到 的 中 间 结 果 再 与 前 一 个 密 文 分 组 
(注意 是 解密 之 前 的 密 文 分 组 ) 进行 异 或 后 得 到 本 次 明文 分 组 。 在 这 种 方法 中 , 每 个 分 组 的 结果 都 
依赖 于 它 前 面 的 分 组 。 同 时 ， 第 一 个 分 组 也 依赖 于 初始 向 量 ， 初 始 向 量 的 长 度 和 分 组 相同 。 但 要 注 
意 的 是 ， 加 密 时 的 初始 向 量 和 解密 时 的 初始 向 量 必须 相同 。 

CBC 模式 需要 初始 向 量 〈 长 度 与 分 组 大 小 相同 ) 参与 计算 第 一 组 密 文 ， 第 一 组 密 文 当 作 向 量 
与 第 二 组 数据 一 起 计算 后 ， 再 进行 加 密 ， 产 生 第 二 组 密 文 ， 后 面 以 此 类 推 。 具 体 流程 可 以 参考 图 
19-10. 





Plaintext Plaintext Plaintext 
TH CONT LLIIIIIT] 
Initialization Vector (IV) 
CLITIIIT = 市 = 由 = 由 
' ' ' 
Block Cipher Block Cipher Block Cipher 
Key —e| Encryption Key — | Encryption Key — | Encryption 
' ' ' 
LLITIIITÀ LLIIIIT3 LLLLLIITÀ 
Ciphertext Ciphertext Ciphertext 


Cipher Block Chaining (CBC) mode encryption 加 密 


Initialization Vector (IV) Ciphertext Ciphertext Ciphertext 


CITT CNTT 
' : ' ] ' 
Block Cipher Block Cipher Block Cipher 
Key —-| Decryption Key — | Decryption Key —e Decryption 
' ' ' 
LLLIILIL] LLLILILII LLLILILI 
Plaintext Plaintext Plaintext 
Cipher Block Chaining (CBC) mode decryption f 
图 19-10 


CBC 是 最 为 常用 的 工作 模式 。 它 的 主要 缺点 在 于 加 密 过 程 是 串 行 的 ， 无 法 被 并 行 化 〈 因 为 后 
一 个 运算 要 等 到 前 一 个 运算 的 结果 后 才能 开始 ) 。 另外， 明文 中 的 微小 改变 会 导致 其 后 的 全 部 密 文 
块 发 生 改变 ， 这 是 其 又 一 个 缺点 : 加密 时 可 能 会 有 误差 传递 。 

而 在 解密 时 ， 因 为 是 把 前 一 个 密 文 分 组 作为 当前 向 量 ， 所 以 不 必 等 前 一 个 分 组 运算 完毕 ， 解 
密 时 可 以 并 行 化 。 解密 时 , 密 文中 一 位 的 改变 只 会 导致 其 对 应 的 明文 块 以 及 下 一 个 明文 块 的 对 应 位 
(因为 是 异 或 运算 ) 发 生 改变 ， 不 会 影响 其 他 明文 的 内 容 ， 所 以 解密 时 不 会 有 误差 传递 。 
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3. CFB 模式 

CFB 模式 和 CBC 类 似 ， 也 需要 初始 向 量 。 加 密 第 一 个 分 组 时 ， 先 对 初始 向 量 进行 加 密 ， 得 到 
的 中 间 结 果 与 第 一 个 明文 分 组 进行 异 或 得 到 第 一 个 密 文 分 组 ; 加 密 后 面 的 分 组 时 , 把 前 一 个 密 文 分 
组 作为 向 量 先 加 密 ， 得 到 的 中 间 结 果 再 和 当前 明文 分 组 进行 异 或 得 到 密 文 分 组 。 解 密 时 ， 解 密 第 一 
个 分 组 时 ， 先 对 初始 向 量 进行 加 密 运算 (注意 用 的 是 加 密 算法 ) ， 得 到 的 中 间 结 果 再 与 第 一 个 密 文 
分 组 进行 异 或 得 到 明文 分 组 ; 解密 后 面 的 分 组 时 , 把 上 一 个 密 文 分 组 当 作 向 量 进行 加 密 运算 (注意 
用 的 是 加 密 算法 ), 得 到 的 中 间 结 果 再 和 本 次 的 密 文 分 组 进行 异 或 得 到 本 次 的 明文 分 组 , 如 图 19-11 
所 示 。 


Initialization Vector (IV) 



























































* M TY 
Block Cipher Block Cipher Block Cipher 
Key —e| Encryption Key 一 ~| Encryption Key —e| Encryption 
Plaintext Plaintext | 
onn — e Œ 一 > 中 Plaintext ; 
| | L—e 
' TY 
ET LLLLLLLLIJ [EIECIERIEI 
Ciphertext Ciphertext Ciphertext 


Cipher Feedback (CFB) mode encryption 


Initialization Vector (IV) 


| i } } 








Block Cipher Block Cipher | Block Cipher 
Key —» Encryption | Key — *| Encryption Key 一 ~ Encryption 
| 
p -—LLLILIITI $5 — CN & -—LIIIIIITJ 
Ciphertext i Ciphertext T Ciphertext 
EELLLLELI LELLLE] L EEE 
Plaintext Plaintext Plaintext 


Cipher Feedback (CFB) mode decryption 
图 19-11 

IH CBC 一 样 ， 加 密 时 因为 要 等 前 一 次 的 结果 ， 所 以 只 能 串 行 ， 无 法 并 行 计算 。 解 密 时 因为 不 
用 等 前 一 次 的 结果 ， 所 以 可 以 并 行 计算 。 

4. OFB 模式 

OFB 模式 也 需要 初始 向 量 。 加 密 第 一 个 分 组 时 ， 先 对 初始 向 量 进行 加 密 ， 得 到 的 中 间 结 果 与 
第 一 个 明文 分 组 进行 异 或 得 到 第 一 个 密 文 分 组 ; 加 密 后 面 的 分 组 时 ， 把 前 一 个 中 间 结 果 ( 前 一 个 分 
组 的 向 量 的 密 文 ) 作为 向 量 先 加 密 , 得 到 的 中 间 结 果 再 和 当前 明文 分 组 进行 异 或 得 到 密 文 分 组 。 解 
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密 时 ,解密 第 一 个 分 组 时 ， 先 对 初始 向 量 进 行 加密 运 算 ( 注 意 用 的 是 加 密 算法 ) ， 得 到 的 中 间 结 果 
再 与 第 一 个 密 文 分 组 进行 异 或 得 到 明文 分 组 ; 解密 后 面 的 分 组 时 ,把 上 一 个 中 间 结 果 (前 一 个 分 组 
的 向 量 的 密 文 ， 因 为 用 的 依然 是 加 密 算法 ) 当 作 向 量 进行 加 密 运 算 (注意 用 的 是 加 密 算法 ) ， 得 到 
的 中 间 结 果 再 和 本 次 的 密 文 分 组 进行 异 或 得 到 本 次 的 明文 分 组 ， 如 图 19-12 和 图 19-13 所 示 。 
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Output Feedback (OFB) mode encryption 
I] 19-12 
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Ciphertext | Ciphertext Ciphertext 
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LLELLLE LILLILLLITJ ON 
Plaintext 


Plaintext Plaintext 


Output Feedback (OFB) mode decryption 
图 19-13 
如 图 19-12 所 示 是 加 密 过 程 ， 如 图 19-13 所 示 是 解密 过 程 。 
19.9.3 了 解 库 和 头 文件 


OpenSSL 的 加 解密 函数 都 包含 在 库 文件 /usr/lib64/libcrypto.so 中 ， 有 兴趣 的 话 ， 可 以 用 nm 命 
令 查 看 一 下 里 面 的 导出 函数 : 


[root@localhost lib64]# nm -D libcrypto.so 


里 面 函数 较 多 ， 或 许 SecureCRT 窗口 显示 不 全 ， 可 以 设置 SecureCRT 窗口 显示 的 内 容 行 数 多 
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一 些 ， 具 体 方法 如 下 。 


(1) 打开 Options— Session Options 一 Terminal 一 Emulation， 如 图 19-14 所 示 。 





192168121 - SecureCRT 


-= - - ~ s cw 











Hle Edit View [Options | Transer Script ]Tools Window Help 


3 33 [3 53 a9 |E session Opsons.-. AB eus agran 


Global Options... 

















70192168121 x 











Not all tasks are performed with the same frequency, but Redis checks for 
tasks to perform accordingly to the specified "hz" value. 


By default "hz" is set to 10. Raising the value will use more CPU when 
Redis is idle, but at the same time will make Redis more responsive when 
there are many keys expiring at the same time, and timeouts may be 
handled with more precision. 


The range is between 1 and 500, however a value over 100 is usually not 
a good idea. Most users should use the default of 10 and raise this up to 
100 only im environments where very low latency is required. 


| 


when a child rewrites the aor file, if the following option is enabled 
the file will be fsync-ed every 32 'MB cf data generated. This is useful 


Redis calls Auto Save Options perform many background tasks, Tike ~ 
closing conn * imecut, purging expired keys that are 
never reques re Selings Now 


* big latency spikes. 
aof-Fewrite-incremental-fsync yes 





[root@localhost redis-2.8.17]4 Wf 


* in order to commit the file to the disk more incrementally and avoid 


a 








Configure session opti ssh2: AES-256-CTR 24, 32 24 Rows, 80 Cols 











vr100 CAP NUM 








图 19-14 


在 Scrollback 下 的 Scrollback buffer 文本 框 中 输入 需要 显示 的 最 大 行 数 ， 可 以 设置 的 最 大 行 数 


是 32000， 如 图 19-15 所 示 。 
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Category: 
I- Connection Emulation 
Logon Actions 
白 -SSH2 RE 
SFTP Session Terminal: |vr100 v| 加 ANsI Color 
Advanced Use color scheme 
日 Port Forwarding 
El Select an alternate keyboard emulation 
Default - 
Sze 


© Retain size and font 


C Comi | 











图 19-15 


加 解密 算法 的 声明 文件 都 存放 在 /usr/local/ssl/include/openssl 下 ， 可 以 用 Is 命令 看 下 : 


[root@localhost lib64]4 ls /usr/local/ssl/include/openssl 


cast.h dh.h 


x509.h 


aes.h 
ssl.h 


e os2.h 


md5.h 


pem2.h rsa.h 
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asnl.h cmac.h dsa.h err.h mdc2.h pem.h 
safestack.h stack.h x509v3.h 
asnl mac.h cms.h dso.h evpzj.h modes.h pkcsl2.h seed.h 


symhacks.h  x509 vfy.h 
asnit.h comp.h dtlsl.h  hmac.h objects.h pkcs7.h  sha.h 
tlsl.h 


bio.h conf api.h ebcdic.h idea.h obj mac.h pqueue.h srp.h tsh 
blowfish.h conf.h ecdh.h krb5 asn.h ocsp.h rand.h srtp.h 
txt_db.h 
bn.h crypto.h ecdsa.h kssl.h opensslconf.h rc2.h ss123.h 
ui compat.h 
buffer.h des.h ec.h lhash.h opensslv.h rc4.h ssl2.h ui.h 
camellia.h des old.h engine.h md4.h ossl typ.h ripemd.h ss13.h 
whrlpool.h 


[rootGlocalhost lib64]4 


可 以 看 到 ，des.h、aes.h、rsah 都 在 ， 而 OpenSSL 为 了 让 大 家 使 用 方便 ， 把 这 些 算法 的 声明 都 
放 到 了 同 目录 的 evp.h 中 ， 这 样 在 开发 时 ， 只 需要 包含 evp.h 即 可 。 大 家 可 以 使 用 cat 命令 看 看 这 
个 文件 ， 做 到 心里 有 数 。 


19.10 利用 OpenSSL 进行 对 称 加 解密 


加 密 技术 是 最 常用 的 安全 保密 手段 ， 利 用 技术 手段 把 重要 的 数据 变 为 乱码 (加 密 ) 传送 ， 到 
达 目 的 地 后 再 用 相同 或 不 同 的 手段 还 原 (解密 )。 

加 密 技术 可 以 分 为 两 类 ， 即 对 称 加 密 技术 和 非 对 称 加 密 技术 。 对 称 加 密 的 加 密 密 钥 和 解密 密 
钥 相同 ， 常 见 的 对 称 加 密 算法 有 DES. AES. SMI. SM4 等 ， 非 对 称 加 密 又 称 为 公开 密 钥 加 密 ， 
它 使 用 一 对 密 钥 分 别 进行 加 密 和 解密 操作 ， 其 中 一 个 是 公开 密 钥 〈Public-Key) ， 另 一 个 是 由 用 户 
自己 保存 〈 不 能 公开 ) 的 私有 密 钥 (Private-Key) , D RSA, ECC 算法 为 代表 。OpenSSL 对 这 两 
种 加 密 技术 都 支持 。 这 里 先 讲 对 称 加 解密 。 


19.10.1 一 些 基本 概念 


1. 密 钥 

密 钥 是 一 种 参数 ， 它 是 在 将 明文 转换 为 密 文 或 将 密 文 转换 为 明文 的 算法 中 输入 的 参数 。 密 钥 
分 为 对 称 密 钥 与 非 对 称 密 钥 。 使 用 对 称 密 钥 是 加 密 者 和 解密 者 使 用 同一 把 密 钥 , 使 用 非 对 称 密 钥 则 
是 加 密 者 和 解密 者 使 用 不 同 的 密 钥 。 

2. 初始 向 量 


初始 向 量 或 称 初 向 量 ， 是 一 个 固定 长 度 的 比特 串 。 一 般 使 用 时 会 要 求 它 是 随机 数 或 伪 随 机 数 
(pseudorandom) 。 使 用 随机 数 产生 的 初始 向 量 使 得 同一 个 密 钥 加 密 的 结果 每 次 都 不 同 ， 这 样 攻击 
者 难以 对 同一 把 密 钥 的 密 文 进 行 破解 。 
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19.10.2 “对称 加 解密 相关 函数 


1. 上 下 文 初 始 化 函数 EVP_CIHER_CTX init 


该 函数 用 于 初始 化 密码 算法 上 下 文 结构 体 ， 即 EVP_CIPHER_CTX 结构 体 ， 只 有 经 过 初始 化 
的 EVP_CIPHER_CTX 结构 体 才能 在 后 续 函数 中 使 用 。 函 数 声 明 如 下 : 


void EVP CIPHER CTX init (EVP CIPHER CTX *a); 


其 中 , 参数 a 是 要 初始 化 的 密码 算法 上 下 文 结构 体 指针 , 该 结构 体 EVP_CIPHER_CTX 的 定义 
如 下 : 


struct evp cipher ctx st { 


const EVP CIPHER *cipher; // 密 码 算法 上 下 文 结构 体 指针 
ENGINE *engine; // 密 码 算 法 引擎 

int encrypt; // 标 记 加 密 或 解密 

int buf len; // 运 算 剩余 的 数据 长 度 


unsigned char oiv[EVP MAX IV LENGTH]; // 初 始 iv 
unsigned char iv[EVP MAX IV LENGTH];  // 运 算 中 的 ijv， 即 当前 iv 
unsigned char buf[EVP MAX BLOCK LENGTH]; /* saved partial block */ 


int num; /* used by cfb/ofb/ctr mode */ 

void *app data; /* application stuff */ 

int key len; /* May change for variable length cipher */ 
unsigned long flags; /* Various flags */ 

void *cipher data; /* per EVP data */ 


int final used; 

int block mask; 

unsigned char final[EVP MAX BLOCK LENGTH]; /* possible final block */ 
) /* EVP CIPHER CTX */ ; 


2. 加 密 初始 化 函数 EVP. Encryptlnit ex 
该 函数 用 于 加 密 初始 化 ， 设 置 具体 加 密 算法 、 加 密 引 擎 、 密 钥 ， 初 始 向 量 等 参数 。 该 函数 声 
明 如 下 : 


int EVP EncryptInit ex(EVP CIPHER CTX *ctx, const EVP CIPHER *cipher, ENGINE 
*impl, const unsigned char *key, const unsigned char *iv) 


【参数 说 明 】 


€ ctx: [in] 是 已 经 被 函数 EVP_CIPHER_CTX init 初始 化 过 的 算法 上 下 文 结构 体 指针 。 

€ cipher: [in] 表 示 具 体 的 加 密 函 数 ， 是 一 个 指向 EVP_CIPHER 结构 体 的 指针 ， 指 向 
EVP_CIPHER* 类 型 的 函数 。 在 OpenSSL 中 ， 对 称 加 密 算法 的 格式 都 以 函数 形式 提 
共 ， 其 实 该 函数 返回 一 个 该 算法 的 结构 体 ， 其 形式 一 般 如 下 : 

EVP CIPHER*  EVP *(void) 


常用 的 加 密 算法 如 表 19-3 所 示 。 
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表 19-3 常用 的 加 密 算法 











函数 说 明 

NULL 算法 函数 

const EVP CIPHER* EVP enc null(void); 该 算法 不 做 任何 事情 ， 也 就 是 没有 进行 加 密 处 理 
DES 算法 函数 


const EVP_CIPHER * 


EVP des cbc(void); 


CBC 方式 的 DES 算法 





const EVP_CIPHER * 


EVP des ecb(void); 


ECB 方式 的 DES 算法 





const EVP_CIPHER * 


EVP des cfb(void); 


CFB 方式 的 DES 算法 





const EVP_CIPHER * 


EVP des ofb(void); 


OFB 方式 的 DES 算法 





使 用 两 个 密 钥 的 3DES 算法 





const EVP_CIPHER 


*EVP des ede cbc(void); 


const EVP. CIPHER 


const EVP. CIPHER 


*EVP des ede(void); 


*EVP des ede ofb(void); 


const EVP. CIPHER * EVP des ede cfb(void); 


使 用 3 个 密 钥 的 3DES 算法 


const EVP_CIPHER * 


EVP des ede3 cbc(void); 


const EVP. CIPHER * 
const EVP. CIPHER * 


EVP des ede3(void); 


EVP des ede3 ofb(void); 


const EVP. CIPHER * EVP des ede3 cfb(void); 


CBC 方式 的 3DES 算法 , 算法 的 第 一 个 密 钥 和 最 后 一 个 密 
钥 相同 ， 这 样 实际 上 就 只 需要 两 个 密 钥 
ECB 方式 的 3DES 算法 ， 算 法 的 第 一 个 密 钥 和 最 后 一 个 密 
钥 相 同 ， 这 样 实际 上 就 只 需要 两 个 密 钥 
OFB 方式 的 3DES 算法 ， 算 法 的 第 一 个 密 钥 和 最 后 一 个 密 
钥 相 同 ， 这 样 实际 上 就 只 需要 两 个 密 钥 
CFB 方式 的 3DES 算法 ， 算 法 的 第 一 个 密 钥 和 最 后 一 个 密 
钥 相同 ， 这 样 实际 上 就 只 需要 两 个 密 钥 


CBC 方式 的 3DES 算法 ， 算 法 的 3 个 密 钥 都 不 相同 


ECB 方式 的 3DES 算法 ， 算 法 的 3 个 密 钥 都 不 相同 
OFB 方式 的 3DES 算法 ， 算 法 的 3 个 密 钥 都 不 相同 








CFB 方式 的 3DES 算法 ， 算 法 的 3 个 密 钥 都 不 相同 





DESX 算法 





const EVP_CIPHER * EVP desx cbc(void); 


RC4 算法 


CBC 方式 的 DESX 算法 





const EVP_CIPHER * EVP rc4(void); 


RC4 流 加 密 算法 。 该 算法 的 密 钥 长 度 可 以 改变 ， 默 认 是 128 位 





40 位 RC4 算法 


const EVP_CIPHER * EVP rc4 40(void); 


密 钥 长 度 40 位 的 RCA 流 加 密 算法 。 该 函数 可 以 使 用 
EVP rc4 和 EVP. CIPHER CTX set key length 函数 代替 





IDEA 算法 





const EVP. CIPHER * EVP idea cbc(void); 
const EVP CIPHER * EVP idea ecb(void); 


CBC 方式 的 IDEA 算法 
ECB 方式 的 IDEA 算法 





const EVP CIPHER * EVP idea cfb(void); 


CFB 方式 的 IDEA 算法 








const EVP_CIPHER * EVP idea ofb(void); 





OFB 方式 的 IDEA 算法 
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( 续 表 ) 





函数 
RC2 算法 


说 明 





const EVP_ CIPHER * EVP rc2 cbc(void); 


CBC 方式 的 RC2 算法 ， 该 算法 的 密 钥 长 度 是 可 变 的 ， 可 
以 通过 设置 有 效 密 钥 长 度 或 有 效 密 钥 位 的 参数 来 改变 。 默 


认 是 128 位 





const EVP_CIPHER * EVP rc2 ecb(void); 


const EVP CIPHER * EVP rc2 cfb(void); 


const EVP. CIPHER * EVP rc2 ofb(void); 


定 长 的 两 种 RC2 算法 


ECB 方式 的 RC2 算法 ， 该 算法 的 密 钥 长 





度 是 可 变 的 ， 可 


以 通过 设置 有 效 密 钥 长 度 或 有 效 密 钥 位 的 参数 来 改变 。 默 
认 是 128 位 
CFB 方式 的 RC2 算法 , 该 算法 的 密 钥 长 度 是 可 变 的 ,可 以 
通过 设置 有 效 密 钥 长 度 或 有 效 密 钥 位 的 参数 来 改变 。 默 认 
是 128 位 





OFB 方式 的 RC2 算法 ， 该 算法 的 密 钥 长 


度 是 可 变 的 ， 可 


以 通过 设置 有 效 密 钥 长 度 或 有 效 密 钥 位 的 参数 来 改变 。 默 





认 是 128 位 


const EVP_CIPHER *  EVP rc2 40 cbc(void); | 40 位 CBC 模式 的 RC2 算法 
const EVP. CIPHER * EVP rc2 64 cbc(void); | 64 位 CBC 模式 的 RC2 算法 


Blowfish 算法 

const EVP. CIPHER * EVP bf cbc(void); 
const EVP. CIPHER * EVP bf ecb(void); 
const EVP. CIPHER * EVP bf cfb(void); 
const EVP. CIPHER * EVP bf ofb(void); 
CAST 算法 


const EVP. CIPHER *EVP cast5 cbc(void); 
const EVP. CIPHER *EVP cast5 ecb(void); 


CBC 方式 的 Blowfish 算法 ， 
ECB 方式 的 Blowfish 算法 ， 
CFB 方式 的 Blowfish 算法 ， 


该 算法 的 密 


OFB 方式 的 Blowfish 算法 ， 





CBC 方式 的 CAST 算法 ， 该 算法 的 密 钥 
ECB 方式 的 CAST 算法 ， 该 算法 的 密 钥 


钥 长 度 是 可 变 的 


该 算法 的 密 钥 长 度 是 可 变 的 
该 算法 的 密 钥 长 度 是 可 变 的 
该 算法 的 密 钥 长 度 是 可 变 





长 度 是 可 变 的 


长 度 是 可 变 的 





const EVP_CIPHER *EVP cast5 cfb(void); 


CFB 方式 的 CAST 算法 ， 该 算法 的 密 钥 长 度 是 可 变 的 





const EVP_CIPHER *EVP cast5 ofb(void); 


OFB 方式 的 CAST 算法 ， 该 算法 的 密 钥 1 





长 度 是 可 变 的 





RC5 算法 





const EVP_CIPHER * 
EVP rc5 32 12 16 cbc(void); 


CBC 方式 的 RC5 算法 ， 该 算法 的 密 钥 长 度 可 以 根据 “算法 中 

一 个 数据 块 被 加 密 的 次 数 ” (number of rounds). 来 设置 ， 默认 
是 128 位 密 钥 ， 加 密 次 数 为 12 次 。 目 前 来 说 ， 由 于 RCS 算法 
本 身 实现 代码 的 限制 ， 加 密 次 数 只 能 设置 为 8、12 或 16 








const EVP_CIPHER * 
EVP rc5 32 12 16 ecb(void); 


ECB 方式 的 RC5 算法 , 该 算法 的 密 钥 长 度 可 以 根据 “算法 中 一 
个 数据 块 被 加 密 的 次 数 ” (number of rounds). 来 设置 ， 默 认 是 
128 位 密 钥 , 加密 次 数 为 12 次 。 目 前 来 说 ,由 于 RC5 算法 本 身 
实现 代码 的 限制 ， 加 密 次 数 只 能 设置 为 8、12 或 16 
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函数 
RC5 算法 


说 明 





const EVP_CIPHER * 
EVP rc5 32 12 16 cfb(void); 


CFB 方式 的 RC5 算法 , 该 算法 的 密 钥 长 度 可 以 根据 “算法 
中 一 个 数据 块 被 加 密 的 次 数 ”(number of rounds) 来 设置 ， 
默认 是 128 位 密 钥 ， 加 密 次 数 为 12 次 。 目 前 来 说 ， 由 于 
RC5 算法 本 身 实 现代 码 的 限制 ， 加 密 次 数 只 能 设置 为 8、 
12 或 16 





const EVP_ CIPHER * 


EVP rc5 32 12 16 ofb(void); 


128 位 AES 算法 


192 位 AES 算法 


256 位 AES 算法 


const EVP. CIPHER *EVP aes 128 cbc(void); 
const EVP. CIPHER *EVP aes 128 ecb(void); 
const EVP. CIPHER *EVP aes 128 cfb(void); 
const EVP. CIPHER *EVP aes 128 ofb(void); 


const EVP. CIPHER *EVP aes 192 cbc(void); 
const EVP. CIPHER *EVP aes 192 ecb(void); 
const EVP. CIPHER *EVP aes 192 cfb(void); 
const EVP. CIPHER *EVP aes 192 ofb(void); 


const EVP. CIPHER *EVP aes 256 cbc(void); 
const EVP. CIPHER *EVP aes 256 ecb(void); 


OFB 方式 的 RC5 算法 ， 该 算法 的 密 钥 长 度 可 以 根据 参数 
“算法 中 一 个 数据 块 被 加 密 的 次 数 ” (number ofrounds) 
来 设置 , 默认 是 128 位 密 钥 , 加 密 次 数 为 12 次 。 目 前 来 说 ， 
由 于 RCS 算法 本 身 实 现代 码 的 限制 , 加 密 次 数 只 能 设置 为 

8、12 或 16 


ECB 方式 的 192 位 AES 算法 
CFB 方式 的 192 位 AES 算法 


OFB 方式 的 192 位 AES 算法 


CBC 方式 的 256 位 AES 算法 
ECB 方式 的 256 位 AES 算法 








const EVP_CIPHER *EVP aes 256 cfb(void); 


CFB 方式 的 256 位 AES 算法 








const EVP_CIPHER *EVP aes 256 ofb(void); 


OFB 方式 的 256 位 AES 算法 





参数 cipher 可 以 取 值 上 面 的 函数 名 。 


€ impli: [in] 指向 ENGINE 结构 体 的 指针 ， 表 示 加 密 算法 的 引擎 ， 可 以 理解 为 加 密 算法 
的 提供 者 ， 比 如 提供 硬件 加 密 卡 、 提 供 软 件 算法 等 ， 如 果 取 值 为 NULL， 则 使 用 默认 


引擎 。 


€ key: 表示 加 密 密 钥 ， 长 度 根据 不 同 的 加 密 算法 而 定 。 

€ iv 初始 向 量 ， 当 cipher 所 指 的 算法 为 CBC 模式 的 算法 时 才 有 效 ， 因 为 CBC 模式 需 
要 初始 向 量 的 输入 ， 长 度 是 对 称 算法 分 组 长 度 。 

€ ”返回 值 : 如 果 函 数 执行 成 功 就 返回 1， 否 则 返回 0. 
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值得 注意 的 是 ，key 和 iv 的 长 度 都 是 根据 不 同 算法 而 有 默认 值 ， 比 如 DES 算法 的 key 和 iv 的 
长 度 都 是 8 字 节 ; 3DES 算法 的 key 的 长 度 是 24 字 节 ，iv 是 8 字 节 ;128 位 的 AES 算法 的 key 和 
iv 都 是 16 字 节 。 使 用 时 要 先 根据 算法 而 分 配 好 key 和 iv 的 长 度 空间 。 

3. 加 密 update 函数 EVP_EncryptUpdate 

该 函数 执行 对 数据 的 加 密 。 该 函数 加 密 从 参数 in 输入 的 长 度 为 inl 的 数据 , 并 将 加 密 好 的 数据 
写 入 参数 out 中 。 可 以 通过 反复 调用 该 函数 来 处 理 一 个 连续 的 数据 块 ( 也 就 是 所 谓 的 分 组 加 密 ， 一 
组 一 组 地 加 密 ) 。 写 入 out 的 数据 数量 是 由 已 经 加 密 的 数据 的 对 齐 关系 决定 的 ， 理 论 上 来 说 ， 从 0 
到 (inlt+cipher_block_size-1) 的 任何 一 个 数字 都 有 可 能 (单位 是 字 节 ) ， 所 以 输出 的 参数 out BAE 
够 的 空间 存储 数据 。 函 数 声明 如 下 : 


int EVP EncryptUpdate(EVP CIPHER CTX *ctx, unsigned char *out, int *outl, 
const unsigned char *in, int inl); 


【参数 说 明 】 


ctx: [in] 指向 EVP_CIPHER_CTX 的 指针 ， 应 该 已 经 初始 化 过 了 。 
out: [out] 指向 存放 输出 密 文 的 缓冲 区 指针 。 
outl: [out] 输出 密 文 的 长 度 。 
in: [in] 指向 存放 明文 的 缓冲 区 指针 。 
inl: [in] 要 加 密 的 明文 长 度 。 
返回 值 : 如 果 函 数 执行 成 功 就 返回 1， 否 则 返回 0。 

4. 加 密 结束 函数 EVP_EncryptFinal_ex 

函数 EVP_EncyptFinal_ex 用 于 结束 数据 加 密 ， 并 输出 最 后 剩余 的 密 文 。 由 于 分 组 对 称 算法 是 
对 数据 块 〈 分 组 ) 操作 的 ， 原 文 数据 〈 明 文 ) 的 长 度 不 一 定 为 分 组 长 度 的 倍数 ， 因 此 存在 数据 补 齐 
(就 是 在 原文 数据 的 基础 上 进行 填充 ,填充 到 整个 数据 长 度 为 分 组 的 倍数 ) ， 最 后 输出 的 密 文 就 是 
最 后 补 齐 后 的 分 组 密 文 。 比 如 使 用 DES 算法 加 密 10 字 节 长 度 的 数据 ， 由 于 DES 算法 的 分 组 长 度 
是 8 字 节 ， 因 此 原文 将 补 齐 到 16 字 节 。 当 调用 EVP_EncryptUpdate 函数 时 ， 返 回 8 字 节 密 文 ， 
EVP EncryptFinal ex 函数 返回 最 后 剩余 的 8 字 节 密 文 。 函 数 EVP_EncryptFinal_ex 的 声明 如 下 : 


int EVP EncryptFinal ex(EVP CIPHER CTX *ctx, unsigned char *out, int *outl); 
【参数 说 明 】 

€ ctx: [in] EVP_CIPHER_CTX 结构 体 。 

€ out: [out] 指向 输出 密 文 缓冲 区 的 指针 。 

9 outl: [out] 指向 一 个 整 型 变量 ， 该 变量 存储 输出 的 密 文 数据 长 度 。 

e ”返回 值 : 如 果 函 数 执行 成 功 就 返回 1， 否 则 返回 0。 

5. 解密 初始 化 函数 EVP_Decryptlnit_ex 

和 加 密 一 样 ， 解 密 时 也 要 先 初始 化 ， 作 用 是 设置 密码 算法 、 加 密 引 擎 、 密 钥 、 初 始 向 量 等 参 
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数 。 函 数 EVP_DecryptInit_ex 的 声明 如 下 : 


int EVP DecryptInit ex(EVP CIPHER CTX *ctx,const EVP CIPHER *cipher,ENGINE 
*impl,const unsigned char *key,const unsigned char *iv); 


【参数 说 明 】 


€ ctx: [in] EVP. CIPHER CTX 结构 体 。 

© cipher: [in] 指向 EVP_CIPHER， 表 示 要 使 用 的 解密 算法 。 

€ impl: [in] 指向 ENGINE， 表 示 解 密 算 法 使 用 的 加 密 引 擎 。 应 用 程序 可 以 使 用 自 定义 
的 加 密 引 擎 ， 如 硬件 加 密 算法 等 。 如 果 取 值 为 NULL， 则 使 用 默认 引擎 。 

€ key: [in] 解密 密 钥 ， 其 长 度 根据 解密 算法 的 不 同 而 不 同 。 

€ dv 初始 向 量 ， 根 据 算法 的 模式 而 确定 是 否 需要 ， 比 如 CBC 模式 是 需要 iv 的 。 长 度 
同 分 组 长 度 。 

€ ”返回 值 : 如 果 函 数 执行 成 功 就 返回 1， 否 则 返回 0。 

6. 解密 update 函数 EVP_DecryptUpdate 

该 函数 执行 对 数据 的 解密 。 函 数 声 明 如 下 : 


int EVP DecryptUpdate(EVP CIPHER CTX *ctx,unsigned char *out,int *outl,const 
unsigned char *in,int inl); 


【参数 说 明 】 


€ ctx: [in] EVP_CIPHER_CTX 结构 体 。 

€ out [out] 指向 解密 后 存放 明文 的 缓冲 区 。 

@ outl: [out] 指向 存放 明文 长 度 的 整 型 变量 。 

€ in: [in] 指向 存放 密 文 的 缓冲 区 的 指针 。 

€ inl: [in] 指向 存放 密 文 的 整 型 变量 。 

€ ”返回 值 : 如 果 函 数 执行 成 功 就 返回 1， 否 则 返回 0。 

7. 解密 结束 函数 EVP_DecryptFinal_ex 

该 函数 用 于 结束 解密 ， 输 出 最 后 剩余 的 明文 。 函 数 声明 如 下 : 

int EVP DecryptFinal ex(EVP CIPHER CTX *ctx,unsigned char *outm,int *outl); 
【参数 说 明 】 


€ cix: [in] EVP_CIPHER_CTX 结构 体 . 

© out: [out] 指向 输出 的 明文 缓冲 区 指针 。 

€ outl: [out] 指向 存储 明文 长 度 的 整 型 变量 。 

这 些 函 数 都 可 以 在 evp.h 中 看 到 原型 ， 另 外 还 有 一 套 没有 _ex 结尾 的 加 解密 函数 ， 如 
EVP_Encryptmit、EVP_Decryptmit 等 ， 它 们 是 旧版 本 OpenSSL 的 函数 ， 现 在 已 经 不 推荐 使 用 了 ， 
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而 使 用 前 面 讲述 的 带 有 _ex 结尾 的 函数 。 旧 版 的 函数 不 支持 外 部 加 密 引 擎 , 使 用 的 都 是 默认 的 算法 。 
EVP Encryptlnit 就 相当 于 EVP. Encryptlnit ex， 第 3 个 参数 为 NULL。 
前 面 我 们 讲述 了 EVP 的 加 解密 函数 。 具 体 使 用 的 时 候 ， 一 般 按照 以 下 流程 进行 。 


(1) EVP CIPHER CTX init: 初始 化 对 称 计算 上 下 文 。 

(2) EVP des ede3 ecb: 返回 一 个 EVP_CIPHER， 假 设 现在 使 用 DES 算法 。 

(3) EVP_EncryptInit_ex: 加 密 初 始 化 函数 ， 本 函数 调用 具体 算法 的 init 回调 函数 ， 将 外 送 密 
$H key 转换 为 内 部 密 钥 形式 ， 将 初始 化 向 量 iv 复制 到 ctx 结构 中 。 

(4) EVP EncryptUpdate: WER, 用 于 多 次 计算 调用 了 具体 算法 的 do cipher 回调 函数 。 

(5) EVP_EncryptFinal_ex: 获取 加 密 结果 ， 函 数 可 能 涉及 填充 ， 调 用 了 具体 算法 的 do cipher 

(6) EVP Decryptlnit ex: 解密 初始 化 函数 。 

(7) EVP_DecryptUpdate: 解密 函数 ,用 于 多 次 计算 ， 调 用 了 有 具体 算法 的 do_cipher 回调 函数 。 

(8) EVP DecryptFinal 和 EVP_DecryptFinal_ex: 获取 解密 结果 ， 函 数 可 能 涉及 填充 ， 调 用 了 
具体 算法 的 do_cipher 回调 函数 。 

(9) EVP CIPHER CTX cleanup: 清除 对 称 算法 上 下 文 数据 ， 它 调用 用 户 提供 的 销毁 函数 清 
除 内 存 中 的 内 部 密 钥 以 及 其 他 数据 。 


下 面 我 们 来 看 一 个 加 解密 实例 。 


【 例 19.2】 对 称 加 解密 的 综合 例子 
(1) 打开 UE， 输 入 代码 如 下 : 








#include «openssl/evp.h» 
#include <string.h> 
#define FAILURE -1 
#define SUCCESS 0 


int do encrypt (const EVP CIPHER *type, const char *ctype) 
{ 
unsigned char outbuf[1024]; 
int outlen, tmplen; 
unsigned char key[] - ( 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 
Tsp ter 177 187 DON 20; 5217922785239 (7 
unsigned char ivi] = { 1; 2; 3, Ar 5; 6r Tr 8 Ì3 


char intext[] = "Helloworld"; 
EVP CIPHER CTX ctx; 
FILE *out; 


EVP CIPHER CTX init (&ctx); 
EVP EncryptInit ex(&ctx, type, NULL, key, iv); 


if (!EVP EncryptUpdate(&ctx, outbuf, &outlen, (unsigned char*)intext, 
(int)strlen(intext))) ( 
printf("EVP EncryptUpdate Wn"); 
return FAILURE; 
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if (!EVP EncryptFinal ex(&ctx, outbuf + outlen, &tmplen)) { 
printf("EVP EncryptFinal ex Mn"); 
return FAILURE; 


outlen += tmplen; 
EVP CIPHER CTX cleanup (&ctx); 


out = fopen("./cipher.dat", "wb*"); 
fwrite(outbuf, 1, outlen, out); 
fflush(out); 

fclose(out); 

return SUCCESS; 


int do decrypt(const EVP CIPHER *type, const char *ctype) 


unsigned char inbuf[1024] = { 0 ); 

unsigned char outbuf[1024] - ( 0 ); 

int outlen, inlen, tmplen; 

unsigned char key[] = ( 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 
ED i 18, 19,520; 021.0999 093. 1) 

unsigned char iv[] = ( 1, 2, 3, 4, 5, 6, 7, 8 ); 


EVP CIPHER CTX ctx; 

FILE *in = NULL; 

EVP CIPHER CTX init (&ctx); 

EVP DecryptInit ex(&ctx, type, NULL, key, iv); 


in = fopen("cipher.dat", "r"); 
inlen = fread(inbuf, 1, sizeof(inbuf), in); 
fclose(in); 


printf("Readlen: $dWn", inlen); 

if (!EVP DecryptUpdate(&ctx, outbuf, &outlen, inbuf, inlen)) ( 
printf("EVP DecryptUpdate Wn"); 
return FAILURE; 


if (!EVP DecryptFinal ex(&ctx, outbuf + outlen, &tmplen)) ( 
printf("EVP DecryptFinal ex Wn"); 
return FAILURE; 


outlen += tmplen; 
EVP CIPHER CTX cleanup (&ctx); 
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printf("Result: WMn$sWMn", outbuf); 


return SUCCESS; 


int main(int argc, char *argv[]l) 


do encrypt(EVP des cbc(), "des-cbc"); 
do decrypt(EVP des cbc(), "des-cbc"); 


do encrypt(EVP des ede cbc(), "des-ede-cbc"); 
do decrypt(EVP des ede cbc(), "des-ede-cbc"); 


do encrypt(EVP des ede3 cbc(), "des-ede3-cbc"); 
do decrypt(EVP des ede3 cbc(), "des-ede3-cbc"); 


return 0; 


) 


在 代码 中 ， 我 们 把 字符 串 “Helloworld ”进行 加 密 后 存 入 文件 cipher.dat， 解 密 时 从 该 文件 中 读 
取 密 文 并 解密 ， 然 后 输出 明文 。 


(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 














[root@localhost test]# g++ test.cpp -o test -lcrypto 
[root@localhost test]# ./test 
Readlen: 16 

Result: 

Helloworld 

Readlen: 16 

Result: 

Helloworld 

Readlen: 16 

Result: 

Helloworld 


19.11 ”Crypto++ 的 简介 


每 种 强大 的 语言 都 有 相应 的 密码 安全 方面 的 库 ， 比 如 Java 自 带 加 解密 库 。 那 么 Ct+ 有 没有 这 
样 的 库 呢 ? 答案 是 肯定 的 ， 那 就 是 “小 名 易 易 ”的 Crypto++。 

Crypto++ 是 一 个 C++ 编写 的 密码 学 类 库 。 读 过 《过 河 卒 》 的 朋友 还 记得 作者 的 那个 不 愿意 去 
微软 工作 的 儿子 吗 ? 就 是 Cryptot+ 的 作者 WeiDai。Crypto++ 是 一 个 非常 强大 的 密码 学 库 , 在 密码 
学 界 很 受 欢迎 。 虽 然 网 络 上 有 很 多 密码 学 相关 的 代码 和 库 ， 但 是 Cryptot++ 有 其 明显 的 优点 。 主 要 
是 功能 全 、 统 一 性 好 ， 例 如 椭圆 曲线 加 密 算法 和 AES 算法 在 OpenSSL 的 Crypto 库 中 还 没 最 终 完 
成 ， 而 在 Crypto++ 中 就 支持 得 比较 好 。 
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基本 上 密码 学 中 需要 的 主要 功能 都 可 以 在 里 面 找到 。Crypto++ 是 由 标准 的 C++ 写成 的 ， 学 习 
C++、 密 码 学 、 网 络 安全 都 可 以 通过 阅读 Crypto++ 的 源 代码 得 到 启发 和 提高 。 
Cryptot+ 是 一 个 开源 库 ， 其 官方 网 站 网 址 是 www.cryptopp.com。 


19.12 ”Crypto++ 的 编译 


我 们 可 以 从 其 官方 网 站 上 下 载 最 新 源 代码 , 这 里 下 载 下 来 的 文件 名 是 cryptopp610.zip, 是 一 个 
ZIP 压缩 文件 ， 我 们 可 以 把 它 放 到 Linux 下 解压 缩 : 


[root@localhost soft]# unzip cryptopp610.zip -d cryptopp610 
加 -d 是 解压 到 目录 cryptopp610 下 ， 这 个 目录 会 自动 建立 。 
解压 完毕 后 ， 进 入 目录 cryptopp610， 然 后 用 make 进行 编译 : 


[root@localhost soft]# cd cryptocpp610/ 

[root@localhost cryptocpp610]# make 

稍 等 片刻 ， 编 译 完成 ， 此 时 会 在 文件 夹 cryptocpp610 下 生成 一 个 静态 库 libcryptopp.a， 有 了 这 
个 静态 库 ， 我 们 就 可 以 在 应 用 程序 中 使 用 Crypto++ 提 供 的 加 解密 函数 了 。 


19.13 ”Crypto++ 进 行 AES 加 解密 


前 面 我 们 通过 Crypto++ 源 代码 编译 出 了 一 个 静态 库 libcryptopp.a, 现在 开始 使 用 它 。 首 先 看 一 
个 例子 ， 这 个 例子 是 直接 用 AES 加 密 一 个 块 ，AES 的 数据 块 (分 组 ) 大 小 为 128 位 ， 密 钥 长 度 可 
选择 128 位 、192 位 或 256 位 。 直 接 用 AES 加 密 一 个 块 很 少 用 ， 因 为 我 们 平常 都 是 加 密 任意 长 度 
的 数据 ， 需 要 选择 CFB 等 加 密 模 式 。 但 是 直接 的 块 加 密 是 对 称 加 密 的 基础 。 
【 例 19.3】 一 个 使 用 Crypto++ 库 的 例子 

(1) 打开 UE， 然 后 输入 代码 如 下 : 


#include <iostream> 
using namespace std; 


#include «aes.h» 
using namespace CryptoPP; 


int main() 


t 


//AES 中 使 用 的 固定 参数 是 以 类 AEs 中 定义 的 enum 数 据 类 型 出 现 的 ， 而 不 是 成 员 函 数 或 变量 
// 因 此 需要 用 : :符号 来 索引 

cout << "AES Parameters: " << endl; 

cout << "Algorithm name : " «« AES::StaticAlgorithmName() << endl; 





Linux 下 的 安全 编程 第 19 章 





) 


//crypto++ 库 中 一 般 用 字 节 数 来 表示 长 度 ， 而 不 是 常用 的 字 节 数 


cout << "Block size : "<< AES::BLOCKSIZE * 8 << endl; 
cout «« "Min key length : " «« AES::MIN KEYLENGTH * 8 «« endl; 
cout «« "Max key length : " << AES::MAX KEYLENGTH * 8 << endl; 


//AES 中 只 包含 一 些 固定 的 数据 ， 而 加 密 、 解 密 的 功能 由 AESEncryption 和 AESDecryption 来 


// 加 密 过 程 

AESEncryption aesEncryptor; // 加 密 器 

unsigned char aesKey [AES::DEFAULT KEYLENGTH]; // 密 钥 
unsigned char inBlock[AES::BLOCKSIZE] = "123456789"; // 要 加 密 的 数据 块 
unsigned char outBlock[AES: : BLOCKSIZE] ; // 加 密 后 的 密 文 块 
unsigned char xorBlock[AES: : BLOCKSIZE]; // 必 须 全 设 定 为 零 
memset( xorBlock, 0, AES::BLOCKSIZE ); // He 


aesEncryptor.SetKey( aesKey, AES::DEFAULT KEYLENGTH ); // 设 定 加 密 密 钥 
aesEncryptor.ProcessAndXorBlock( inBlock, xorBlock, outBlock ); // 加 密 
// 以 16 进 制 显示 加 密 后 的 数据 
for( int i-0; i«16; i++ ) ( 
cout «« hex «« (int)outBlock[i] «« " "; 

) 
cout «« endl; 
// 解 密 
AESDecryption aesDecryptor; 
unsigned char plainText[AES::BLOCKSIZE]; 
aesDecryptor.SetKey( aesKey, AES::DEFAULT KEYLENGTH ); 
aesDecryptor.ProcessAndXorBlock( outBlock, xorBlock, plainText ); 
for( int i-0; i«16; i++ ) 

cout «« plainText[i]; 
cout «« endl; 
return 0; 


代码 中 有 以 下 几 个 地 方 要 注意 一 下 : 


© AES 并 不 是 一 个 类 ， 而 是 类 Rijndael 的 一 个 typedef- 

© Rijndael 虽然 是 一 个 类 ， 但 是 其 用 法 和 namespace 很 像 ， 本 身 没有 什么 成 员 函 数 和 成 员 变 
dí, 只 是 在 类 体 中 定义 了 一 系列 类 和 数据 类 型 (enum) , 真正 能 够 进行 加 密 、 解密 的 AESEncryption 
和 AESDecryption 都 是 定义 在 这 个 类 内 部 的 类 。 

(8) AESEncryption 和 AESDecryption 除了 可 以 用 SetKey() 函 数 设 置 密 钥 外 , 在 构造 函数 中 也 能 
设置 密 钥 ， 参 数 和 SetKey0 是 一 样 的 。 

@ ProcessAndXorBlockO 可 能 会 让 人 比较 疑惑 ， 函 数 名 的 意思 是 ProcessBlock and XorBlock, 


ProcessBlock 就 是 对 块 进 行 加 密 或 解密 ，XorBlock 在 各 种 加 密 模式 中 使 用 ,这 是 
式 ， 因 此 把 用 来 Xor 操作 的 XorBlock 置 为 0， 这 样 Xor 操作 就 不 起 作用 了 。 

















有 我们 不 需要 应 用 模 
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(2) 保存 代码 为 test.cpp， 上 传 到 Linux， 在 命令 行 下 编译 并 运行 : 


[root@localhost test]# g++ test.cpp -o test -I/root/soft/cryptopp610 
-L/root/soft/cryptopp610 -lcryptopp 

[rootGlocalhost test]# ./test 

AES Parameters: 

Algorithm name : AES 

Block size : 128 

Min key length : 128 

Max key length : 256 

77 6e 2c a5 2 17 7a 5b 19 e4 28 65 26 f3 7e 14 

123456789 








im 目录 名 cryptopp610 不 要 写成 cryptoapp610.. 











